﻿Formal Modelling and Automatic Detection of Resource Exhaustion Attacks Bogdan Groza Politehnica University and institute e-Austria Timisoara, Romania bogdan groza@aut upt ro Marius Minea Politehnica University and institute e-Austria Timisoara, Romania marius@cs upt ro ABSTRACT Many common protocols: TCP, iPSec, etc , are vulnerable to denial of service attacks, where adversaries maliciously consume significant resources of honest principals, leading to resource exhaustion We propose a set of cost-based rules that formalize DoS attacks by resource exhaustion and can automate their detection Our classification separates exces-sive but legal protocol use (e g , flooding) from illegal protocol manipulation that causes participants to waste com-putation time without reaching the protocol goals We also distinguish simple intruder intervention leading to wasteful execution from DoS attacks proper, which can be repeated-ly initiated Our rules can highlight attacks that are unde-tectable by the targeted honest agents, or by all protocol participants We have successfully tested an implementa-tion of the methodology in a validation platform on relevant protocol examples, in what to the best of our knowledge is the first formal automated analysis of DoS attacks Categories and Subject Descriptors C 2 2 [Computer-Communication Networks]: Network Protocols—Protocol verification; K 6 5 [Management of Computing and information Systems]: Security and Protection; C 4 [Performance of Systems]: Reliability, availability and serviceability General Terms Security, Verification Keywords denial of service, formal modeling, automated verification 1 iNTRODUCTiON Protocols that base their security on cryptographic primi-tives are indispensable nowadays However, from a computa-tional perspective, not all cryptographic primitives are cheap Permission to make digital or hard copies of all or part of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page To copy otherwise, to republish, to post on servers or to redistribute to lists, requires prior specific permission and or a fee ASiACCS ’11, March 22-24, 2011, Hong Kong, China Copyright 2011 ACM 978-1-4503-0564-8 11 03 s10 00 While secret-key primitives can be executed in microseconds on modern computers, public-key primitives require a thou-sand time more computational steps and can cause resource exhaustion even on well equipped servers The problem is far-reaching: on low computational power devices, such as sensors, mobile phones, embedded devices, etc , the unjus-tified execution of even simple cryptographic primitives can cause resource exhaustion in recent years, many protocols have been found vulner-able to this kind of attacks and modified variants or coun-termeasures have been proposed in this paper we focus on the automatic detection of these attacks, where honest par-ticipants can be maliciously determined to perform expen-sive operations, such as public-key encryptions or signatures, while the adversary consumes significantly less resources From the point of view of protocol execution, we consider useful to separate resource exhaustion DoS attacks in two main categories: • Resource exhaustion DoS attacks due to excessive use These are attacks in which there is no abnormal use of the protocol, however the adversary as participant con-sumes significantly less resources than other principals thus being capable to cause a DoS Typical examples are attacks on the server side, such as flooding, spam, etc , which do not violate the protocol specification but can exhaust resources of honest principals • Resource exhaustion DoS due to malicious use in these attacks the adversary manages to bring the protocol to an abnormal state (principals are not aware of their correct identities, shared keys do not match, etc ) from which the protocol goals cannot be correct-ly met Many protocols with such vulnerabilities exist, probably the best known is Lowe's attack on the STS protocol , which we will use as one case study Of course, in general denial of service (proper) requires repetition, and one condition for this to take place is the ability of the intruder to control the initiation of a session This condition is sufficient in the case of protocols vulner-able to excessive use since there is no abnormal protocol behaviour in this case, and thus an honest principal cannot detect being under attack (the only prevention is to lim-it the use of the protocol) A commonly used solution to protect the server side are proof-of-work protocols based on moderately hard one-way functions, known as cryptographic puzzles or client puzzles in this context, several protocol-s have been augmented with such constructions, including   , TCP , authentication protocols , etc 326 However, we are also concerned with the second, abusive kind of attack in this case, not only are resources spent, but this is done without achieving the protocol goals For this case we also express additional conditions under which we can determine whether the attack is or not noticeable by honest principals We consider these attacks more severe and their automatic detection to be especially relevant As for the causes of resource exhaustion attacks, our anal-ysis of existing protocols reveals two main design flaws: • Unbalanced costs between participants This can cause DoS inflicted both by adversaries and honest principals and usually affects the server side A common engineering practice adopted in protocols to overcome this is the aforementioned use of client puzzles • Lack of authenticity for the exchanged messages This allows adversaries to intrude and compromise a protocol at lower cost than that incurred by honest par-ticipants For example, the adversary can inflict an unjustified computational cost on some honest principal, or even steal a principal's computational work Conversely, as our case studies show, most protocols that do not exhibit these flaws are also resilient to DoS attacks Therefore, checking for these two vulnerabilities should be good engineering practice for designing DoS-resilient proto-cols However, DoS attacks can be intricate, and protocol designs can thus benefit from formal analysis To detect DoS attacks, we have expressed our rules in the ASLan specification language of the AVANTSSAR toolset , a successor to the AViSPA project , which is analyzed by the back-ends CL-Atse , OFMC and SATMC To enable automatic detection, we need first to integrate cost-s in protocol transitions and adversary actions and second to define rules which use the cost and state information to identify an attack We have shown that our rules can be easily integrated into existing models and work effectively with representative case studies: STS , JFK and some variants of these protocols, providing an automated analysis of resource exhaustion attacks 1 1 Related work The first and best-known approach to formalize DoS at-tacks is the cost-based framework developed by Meadows who also relates DoS resilience to the fail-stop property in-troduced by Gong and Syverson Ramachandran has applied this framework to the JFK protocol and other protocol fragments, and also links the fail-stop property to the non-interference property proposed by Focardi et al Later, a more in-depth analysis of JFK was done by Smith et al who found some attacks to which we refer in the case studies section All these analyses were done by hand, whereas our focus is on the formalization of attack condi-tions in rules that can be used in a toolset for automated protocol validation, which to the best of our knowledge has not been done before Besides formalizing attack states, other research has fo-cused on improving protocols to withstand DoS attacks and formalizing criteria that need to be met by a protocol for re-silience to DoS Matsuura and imai provide a strategy for resilience in three-pass authentications (similar to STS) while later work of the same authors performs an explicit cost calculation of computational resources involved A related protocol is also proposed by Tseng As for resilience criteria, the most common principle to avoid DoS is that the initiator of the protocol must consume more resources than the responder This is the principle behind proof-of-work protocols Five criteria for DoS resilience are given in They include the aforementioned cost comparison indirectly by allowing the responder to react only to legitimate requests, where a request is legitimate only if the initiator has solved a puzzle which consuming more computational resources than the responder However the criteria stated in are infor-mal and relations between them are not clearly established For example, a server should "not perform any expensive op-erations with a client unless" (1) "it is convinced the client is trying to make a legitimate connection" and (2) "it is con-vinced that the client wants to talk to B and not another server M" However, a request made to a different server than the intended one should not be considered a legitimate attempt, thus criterion 2 is implied by criterion 1 Also cri-terion 4 states that "a malicious party must use a very large amount of resources" if it wishes to flood the server, how-ever such a condition is too restrictive for many practical protocols where the sufficient condition is that the server will not waste more resources than the client in particular, Meadows' framework and subsequent analyses use a tolerance relation which a allows a more flexible way to de-fine the limit of resource exhaustion As the criteria are stated informally, without individual examples for each of them, some imprecision is unavoidable The authors also give a formal definition of service resilience for secure key a-greement protocols This definition appears problematic as well, illustrating the need to properly track costs incurred by principals According to , a protocol is defined as DoS-resilient if each server only performs expensive operations in a session that follows an "acceptable pre-session" in which the client performs the proof of work The problem with this definition is that it ignores the server cost in the ses-sion, where a resource-exhausting computation may occur even after the server has protected itself in the pre-session Thus, the definition as stated will fail to correctly identify DoS attacks in contrast, we consider that one cannot consider protocol resilient unless it keeps track of the server cost in each session Our restriction of balanced cost between protocol participants covers criterion 4 from , while the first three criteria are covered by our condition for malicious execution-s This includes the oft-forgotten criterion (3) that the work of some honest principal cannot be stolen by a malicious adversary Regarding proof of work by client puzzles at an algebraic level, this criterion is included by the stricter requirement of unforgeability of client puzzles formalized in it should be noted that even if a protocol does not allow the work of a honest client to be stolen, the adversary might still be able to forge puzzles for which a honest client will waste computational time to solve The property of unforgeabil-ity requires that an adversary is unable to produce a valid puzzle, thus it offers stronger security, but proving this prop-erty requires security reductions that are not meant to be handled symbolically in our framework Thus, the property that the work of a client cannot be stolen ensures safety for the server side but cannot guarantee protection against re-source exhaustion on the client side, a case often neglected by protocol designers The rules we introduce also detect 327 and flag this case as malicious use 2 FORMALiZATiON AND REASONiNG 2 1 Protocol and cost model First we define the protocol model for which we formalize DoS attacks We give a simplified account of the ASLan specification language of the AVANTSSAR toolset , on which we base our implementation Deflnition 1 A symbolic protocol description is a triple P ::= (initialState, TransitionRule*, AttackState*) formed by an initial state, a set of transition rules and a set of attack states, where: i the initial state is a conjunction of ground facts (terms), ii a transition rule has the form L'HS R 'HS where L'HS and 'R 'HS are conjunctions of facts, and L'HS may also contain negative facts, not(Fact), iii an attack state is a conjunction of positive and negative facts (like a P H S) Sending a message, e g , A B : MK,sig(inv(pkA),M) may be modelled with two rules as shown in Figure 1 and an initial state: stateA(a, 3, 0) stateB(b, 3, 0) in ASLan, we denote conjunction of facts F1 F2 with a dot stateA(A, iD, 0) stateA(A, iD, 1) iknows(enc(K, M) sig(inv(pkA), M)) stateB(B, iD, 0) iknows(enc(K, M) sig(inv(pkA), M)) stateB(B, iD, 1) Figure 1: Protocol fragment in ASLan Here stateA and stateB are facts tracking state progress in the two roles, and a, b are principals that can play roles A and B in a session with identifier 3 Sending a message M is modelled by making it available to the intruder, iknows(M); conversely, the intruder might place any known term (includ-ing the actual message sent) on the communication channel Semantics A symbolic protocol description P defines a transition system M = (S,i, ^), where S is the set of states, i is the set of initial states, and S x S is the transition relation, defined as follows Let T be the set of all terms, and F the set of ground facts (Boolean terms) Then the state set S = 2F is the powerset of possible ground facts, and the initial states i are directly defined as a conjunction (set) of ground facts in the protocol description P informally, a rule L'HS R 'HS specifies a transition that replaces in the current state the facts in L'HS with those in R 'HS Formally, there exists a transition S S' iff there exists a rule PF NF R (with PF and NF sets of positive and negative facts) and a substitution a : V T (with V the set of variables in PF), such that: i a(PF) C S (positive facts are satisfied) ii (a' ◦ a)(NF) П S = 0 for all substitutions a' such that (a' o a)(NF) is ground (i e , negative facts are false) iii S' = S   a(PF) U a(R) (positive facts are subtracted and right-hand-side facts are added) To enable cost evaluation, we extend this definition by adding costs to transition rules as well as to adversary actions Deflnition 2 A cost-augmented protocol description CP is a symbolic protocol description where: i cost(P, 0) holds for all principals in the initial state ii transition rules have the form LHS cost(P, Ci) RHS cost(P, C2) where the fact cost(P, C1) denotes that the cost for principal P before the transition is C1, and cost(P, C2) states that the cost after the transition is C2 The cost predicate does not identify a particular session of the protocol, since both for the adversary and for legitimate participants, the cost is accumulated over multiple protocol executions We need to extend the notion of cost to the abilities of the adversary The adversary is equipped with the well-known Dolev-Yao abilities over the communication channel: he can intercept, replay, forge or block messages Besides this, the adversary can use computational abilities, which must be augmented by costs in our model We consider that costs are induced by the following operations: modular exponen-tiation, public-key encryption, decryption and signatures, denoted cexp, cenc, etc This leads to the protocol rules syn-thesized in Equations 1-4 if needed, costs can be attached to other primitives and in the same manner to the Dolev-Yao intruder abilities iknows(X) iknows(Y) cost(i, C1) sum(C1, cexp, C2) iknows(exp(X, Y)) cost(i, C2) (1) iknows(K) iknows(X) cost(i, C1) sum(C1, cenc, C2) iknows(enc(K, X)) cost(i, C2) (2) iknows(enc(K, X)) iknows(K) cost(i, C1) sum(C1, caec, C2) iknows(X) cost(i, C2) (3) iknows(X) iknows(Y) cost(i, C1) sum(C1, csig, C2) iknows(sig(X, Y)) cost(i, C2) (4) Until now, we have not specified whether cost has an al-gebraic value or is modelled symbolically To fix notions, we use as cost set a monoid, as in Meadows' framework ; our approach is also applicable to numeric costs, depending on the capabilities of the employed verifiers Deflnition 3 A cost set is a commutative monoid with operation + over a set S with partial order x for all x,y G S in particular, we consider the set S = {0, low, high, expensive} and the sum defined as Ha, b G S,a + b = max(a, b) We implement this cost structure in our protocol model by defining a fact sum(X, Y, Z) for each pair X, Y where Z = X + Y, e g , sum(high, low, high), etc We consider the cost of the attacker and the honest a-gents directly comparable, by defining a comparison predicate less, e g , less(cheap, expensive), less(medium, expensive) Meadows' framework uses different cost sets for attacker and honest agents, and a relation that defines comparable costs in our case, the tolerance relation is given by the compar-ison predicate less We could obtain the same generality by appropriately scaling cost values and or redefining the comparison if the cost also depends on the principal, for example, if for the adversary it may be more expensive to 328 write on a channel that is already allocated to a differen-t principal, then these facts can be adapted to include the principal's identity as well Thus the tolerance function in the attack condition is flexible and can be adapted according to the requirements of the protocol that is modelled 2 2 Formalizing the attack condition it is not straightforward to define and formalize the con-ditions that characterize a resource exhaustion DoS attack The main reference so far, the framework of Meadows starts out by extending the definition of fail-stop protocols The intuition for DoS resilience is that if the adversary suc-cessfully interferes in a protocol, his cost at that point must exceed some value related to the cost of the honest agent We start from the same point of comparing the cost of the adversary and of the honest victim However, we refine this characterization along several criteria The first classification relates to the way in which the in-truder interferes with protocol execution, causing the DoS attack We distinguish attacks due to excessive use, in which the adversary only acts as an ordinary participant, but can deplete the resources of honest principals by repeated execu-tion at lower cost On the other hand, there are instances of malicious use where the adversary interferes with the protocol, resulting in at least one message reception differing from normal use (more formally, we consider violation of in-jective agreement ) Previous frameworks, such as that of Meadows do not distinguish along this dimension, since a common definition for interfering with a message is used A second dimension relates to forced repetition by the adversary Strictly speaking, we consider that denial of service occurs only if the adversary can repeatedly force a resource-depleting execution, which requires him to be the initiator in the protocol (regardless of whether malicious capabilities are used) To be able to force this repeated resource deple-tion, the adversary may need to rely on a previous session started by an honest participant To model this we will also consider the execution of multiple sessions For the case of malicious executions we do not strictly require the adver-sary to be able to repeat the attack in order to cause DoS, i e , to be the initiator of the protocol This is because we consider that not allowing malicious executions is a good engineering practice and protocols that do not meet this re-quirement should be spotted, even if the adversary may not succeed more than once in mounting such an attack A third criterion concerns the detectability of the attack by the victim or some other honest participant This is important, since undetectable attacks cannot be countered by other means than indiscriminately limiting protocol usage Thus, the simplest case of resource exhaustion is due ex-clusively to excessive use: a responder B is vulnerable to a DoS attack if there is some state where the cost accumulat-ed by B is higher than the one accumulated by the initiator A of the protocol, a role that can be potentially played by an adversary This is a violation of the design rule that the initiator should commit more resources than a responder in this case, the intruder does not need special abilities, but can simply play the role of A, initiating sessions at will To identify the principal initiating the protocol we augment in the protocol model the first transition of the initiator role (assumed to be named A) with the fact initiate(A) The attack condition is then expressed as follows: Attack condition 1 (DoS due to excessive use) A protocol is vulnerable to a resource exhaustion DoS attack on some principal P if, in a session initiated by the adversary, an execution state is reached where the cost accumulated the adversary is less than the one accumulated by P, i e , dos exc(P) := initiate(i) cost(i, Ci) cost(P, Cp) less(Ci, CP) (5) The semantics of an attack condition written in this way in-volves an implicit existential quantification over all variables appearing on the right-hand side At this point, the adversary can simply stop executing protocol steps Repeated protocol executions can lead to resource exhaustion for P , who must observe the respon-der role, incurring higher cost than the adversary in each execution The relation above corresponds to the simple case of a single protocol session; thus, the costs can be tracked per protocol principal rather than per execution instance To model multiple sessions run in parallel, which also cover-s the case of a potential distributed DoS (DDoS), we need to track the costs cumulated from sessions initiated by the adversary This can be achieved by using two distinct tran-sition rules, one for sessions that are initiated by the adver-sary (cumulating cost) and one for case of sessions between honest participants (where no costs need to be tracked) CHS initiate(i, iD) cost(P, Ci) sum(Ci, cstep, C2) 'R 'HS cost(P, C2) (6) CHS initiate(A, iD) not(equal(i, A)) RHS (7) We now define the case when a protocol is maliciously used, without attaining its intended purpose, wasting computa-tional resources of honest participants (at lower cost to the attacker), even though the protocol might not necessarily be initiated by the intruder or repeatable by it To formalize this kind of attack we need to track the cor-respondence between sent and received messages, and ex-press whether they pair up to a proper protocol run For this purpose, we augment each send transition with a fact send(S, R, M, L, iD) meaning that message M is sent by agent S at protocol step labeled L in session iD, intended for re-ceipt by R We also augment every receive transition with a fact recv(S, R, M, L, iD) to denote that message M is received at protocol step L in session iD by receiver R as coming from sender S For correct protocol runs (injective agreement), it must hold that every recv(S, R, M, L, iD) is preceded by a matching send(S, R, M, L, iD) Conversely, if for some value M this agreement is violated, there is an attack on the protocol functionality (notably, authentication) with respect to principal R: tampered(R) : = recv(S, R, M, L, iD) not(send(S, R, M, L, iD)) (8) (the other variables are implicitly quantified existentially) in the following rules, we will use tampered as a macro with the above definition With this, we can express the malicious execution of a protocol as follows: Attack condition 2 (DoS due to malicious use) A protocol is vulnerable to malicious use for participant P if it can reach a state where the adversary cost is lower than 329 the cost of P, and P accepts a value which differs from the prescribed protocol execution, i e , dos mal (P) := initiate(i) tampered(P) cost(i, Ci) cost(P, Cp) less(Ci, CP) (9) The attack conditions for excessive use (5) and malicious use (9) have the same cost comparison, and differ only in the extra condition: malicious use implies tampering with a normal protocol run We may formulate (9) less restric-tively by removing the condition initiate(i) As discussed before, even if the run is not initiated by the attacker and thus not repeatable at will, a malicious use signifies bad protocol design, and should be avoided As with excessive use, such an attack might appear only after a correct protocol run, for example, when the adver-sary can initiate a new session and reuse previous values (captured from participants, or used in a previous session) To model this, participant cost must be added over multiple sessions This is not straightforward because we should not include costs from sessions where the adversary does not interfere, as these are not part of the attack For this purpose, we need to track the cost of a principal separately for each session it participates in We define a predicate scost(Agent, Cost, iD) that keeps track of the cost in a particular session, identified by the additional pa-rameter iD Each protocol rule is now split into three dif-ferent rules, depending on whether the session has already been interfered with by the intruder This is represented by the fact bad(iD), initially false for each session As long as the intruder does not intervene, the cost cstep for the cur-rent step is added to the per-session cost for the executing agent (rule 10) When a session is interfered with (either it is initiated by the intruder, or there is a receipt of a tam-pered message), the per-session cost so far and the cost of the current step are added to the accumulated cost for the principal, and the fact bad(iD) is asserted (rule 11) Finally, for a session already marked as bad, the cost of the step is directly added to the accumulated participant cost (rule 12) CHS not(bad(iD)) send(S, P, M, L, iD) scost(P, Cid, iD) sum(CiD, cstep, CZiD) RHS recv(S, P, M, L, iD) scost(P, C'iD, iD) (10) CHS not(bad(iD)) not(send(S, P, M, L, iD)) cost(P, CP) scost(P, CiD, iD) sum(Cp, cid, Ci) sum(Ci, cstep, CP) RHS recv(S, P, M, L, iD) bad(iD) cost(P, CP) (11) CHS bad(iD) cost(P, CP) sum(CP, cstep, CP) RHS bad(iD) cost(P, CP) (12) Note that in rule 10 the send guard is needed (to express correct execution) only in a receive step (with recv)on the RHS); otherwise, the rule is written without both facts The rules for detecting excessive use (5) and malicious use (9) do not change in the multiple session setting; only updating the cost per principal changes by splitting the rules for protocol steps, as defined above As argued before, it is worth distinguishing the above de-fined vulnerabilities are detectable by the protocol partici- pants The problem is more severe if, while being depleted of resources, an honest agent cannot tell that this is happening maliciously and merely sees an excessive protocol execution Attack condition 3 (Undetectable resource exhaustion) Both excessive and malicious executions are espe-cially dangerous if they are not detected by honest protocol participants as different from normal executions in this case there is no means of protection other than a potential-ly unnecessary blanket limitation of executions that affects honest use as well Participant P cannot detect an attack if it successfully reaches the final state For repeatable attack-s initiated by the intruder, and respectively, for malicious executions, this can be expressed as: dos exc nd(P) := initiate(i) count(P, 0) cost(i, Ci) cost(P, CP) less(Ci, CP) (13) dos mal nd(P) := tampered(P) count(P, 0) cost(i, Ci) cost(P, CP) less(Ci, CP) (14) We use count(Agent, Num) as a fact to keep track of the number of sessions in which a principal is still active Even though the protocol abuse might not be detectable by the participant P under DoS attack, it might be de-tectable by some other participant Q This makes it possi-ble to correct the protocol, by adding an extra confirmation from Q to P , which would then also allow attack detection by P Thus, it becomes relevant to characterize the DoS attacks in which excessive or malicious of the protocol is not de-tectable by any of the protocol participants, as such proto-cols are completely vulnerable, without detection: dos exc all(P) : initiate(i) count(Q, 0) QGagents(^) cost(i, Ci) cost(P, CP) less(Ci, CP) (15) dos mal all(P) : tampered(P) count(Q, 0) QGagents(^) cost(i, Ci) cost(P, CP) less(Ci, CP) (16) Cost of verification steps One key modification in modelling a protocol for DoS analysis in our framework is that verification steps done by principals also need to be modelled as protocol transitions As a result, it becomes easy to model proof-of-work protocols which involve the ver-ification of some cryptographic puzzle before continuing the communication with some principal Coordinated attackers The case of coordinated at-tackers, where certain protocol messages are reused between attackers, is also considered in in their proposal the cost of a particular reused operation is divided by the num-ber of attackers, for example, if the cost required by some computation is expensive and there are n attackers that can reuse this computation then the cost will be 1 x expensive Our approach relies on symbolic computation and there-fore we cannot use algebraic operations such as divisions or multiplications (although the back-ends that we use can be modified to handle them as well) Still, the reuse of al-ready computed values works with the rules defined for the multiple sessions as these values are already added to the in-truder knowledge (thus the intruder will not have additional 330 cost when it reuses them) Thus, in a coordinated attack, attackers that reuse values will have their cost set to null for that particular computation Bounding the attack cost in practice, a model check-er may consume a lot of time to verify the existence of an attack it becomes critical to restrict the arbitrary possi-ble actions of an intruder to those that might lead to an attack in this case, if one determines the maximal cost maxcost(CP,P) for principal P over protocol CP (by ex-ploring the protocol without the intruder), then any DoS attack on principal P needs to have an intruder cost lower than maxcost(CP,P) Thus, the adversary actions can be limited up to this cost Bounding the search in this manner can be done for both single and multiple sessions 3 CASE STUDiES As a first case study we consider the well-known Station-to-Station protocol , also relevant because of its similari-ties to the internet Key Exchange protocol (iKE), which is part of iPSec and commonly used in practice The first at-tacks on it were reported by Lowe , and it has been used as case study by Meadows The protocol and Lowe's attack are depicted in Figure 2 in this attack A tries to talk to B, but Adv succeeds in impersonating B to A and uses this to initiate his own session with B A B : ax B A : ay, Cert в, Ek (sigB (oy ,ox)) A B : Cert A,Ek(sigA (ax,ay)) A Adv(B): ax Adv B: ax B Adv: ay, CertB ,Ek (sigB (ay ,ax)) Adv(B) A: ay, CertB, Ek (sigB (ay ,ax)) A Adv(B): CertA,Ek(sigA(ax ,ay)) Figure 2: Station to Station protocol Lowe’s attack This attack is sometimes considered minor since Adv can not actually recover the key shared between A and B How-ever, both A and B consume computation time performing public-key operations for a protocol run that is of no use to them in the context of our rules this case study is relevant as both attack conditions, for excessive and malicious use, hold First, this is an attack on B due to excessive use be-cause he consumes more resources than Adv while Adv is the initiator of the session Second, this is a case of mali-cious use as B receives a value from Adv that was actually sent by A For A, the second attack rule also holds, we have again a case of malicious use, as A receives a value from Adv(B) that was actually sent by B for the communication with Adv After modelling this protocol in ASLan two of the back-ends found attack traces The CL-Atse model checker reported both attacks from Lowe and verified that the final state of A is reached, thus making the attack unde-tectable by A The OFMC model checker reported a distinct attack: an adversary initiating a protocol with some honest principal can replay ax to honest principals, thus sav-ing himself from performing new computations if one con-siders that values like ax have a uniform distribution then the adversary can initiate conversations with B by simply sending some random value, or use trivial values (1, 2, etc ) for the exponent, thus consuming significantly less resources than honest principals The three-pass handshake proposed by Matsuura and i-mai in is also based on the Diffie-Hellman key agreement but is secure against the previous attacks because the identi-ties of the principals are included in the exchanged messages, making it infeasible for an adversary to use a message in-tended for another principal indeed, the previous attack on STS would not be feasible if these identities were included in the signature Matsuura and imai later proposed versions of the iSAKMP Oakley and iKE key agreement which are resilient to DoS; here, the identities of principals were included as well Later, Mao and Paterson in their s-tudy of iKE drew again attention to the good engineering principle stated previously by Abadi and Needham: if the identity of the principal is relevant for the message then it is prudent to include this identity in the message The same principle makes the protocol proposed by Tseng secure against the attack The second case study is the Just Fast Keying (JFK) protocol proposed by Aiello et al , a protocol with provable security and specifically designed to withstand DoS attack-s The protocol was first analyzed by Ramachandran and later in more detail by Smith et al Both analyses were done using the cost-based framework of Meadows The protocol was deemed DoS-resilient in , provided that ma-licious messages are handled properly, in particular by using caching to deal with replay messages and thus amortizing the cost from expensive verifications in two weakness-es against DoS were outlined, the first comes from the reuse of the Diffie-Hellman exponential and the second involves coordinated attackers Moreover, the paper proposed a new variant that includes client puzzles to increase its resistance This variant is depicted in Figure 3: the modifications from the original JFK consist in adding k as the difficulty level of the puzzle and sol as the solution of the puzzle, i e , k indi-cates the number of leading zeros that H(token||sol) must produce i R : NJ ,gi, iD R Ri : N{, Nr, gr, grpinfoR, iDR, SR[gr, grpinfoR], token, k iR : Nj,NR,gi,gr, token, {iDj,sa,Sj[Ni,Nr,gi,gr, iDr, sa]R, sol R i : {SR[Ni ,NR,gi,gr, iDj ,sa],sa'}K{ ,sol Figure 3: JFK protocol with client puzzles We have modelled this protocol and no DoS attack was found for the side of the responder R However, although probably not a concern of the protocol designers, the model checkers reported attacks for the side of the initiator i Namely, an adversary may initiate sessions with responder R and forward the puzzles that he receives to some honest principal i ; the result is that the adversary can continue his communication without wasting computational time for the puzzle, while principal i consumes time to solve a puzzle that was not intended for him This is a case of malicious use that happens because the puzzle token is not bound by the responder with a signature to the identity of i The same happens with the value of the difficulty level k which is not signed and can be increased by an adversary to make i spend large amounts of time to solve a more difficult puzzle Figure 4 shows the relevant parts of an attack trace reported 331 (a, 1) i : h(NA(1)) gXA(1) idb1 i(b, 1) : h(NA(1)) gXA(1) idb1 (b, 1) i : h(NA(1)) NB(2) gXB(2) idb sig(inv(pkB), gXB(2)) h(hkb gXB(2) NB (2) h(NA(1)) ipi) k i(a, 1) : h(NA(1)) NB(2) gXB(2) idb sig(inv(pkB), gXB(2)) h(hkb gXB(2) NB (2) h(NA(1)) ipi) k (a, 1) i : NA(1) NB(2) gXA(1) gXB(2) h(hkb gXB(2) NB (2) h(NA(1)) ipa) enC(h((gXB)XA(1) h(NA(1)) NB(2) 1))[ida sa siginv(pkA)[h(NA(1)) NB (2) gXA(1) gXB(2) idb sa]] h(h((gXB(2) )XA(1) h(NA(1)) NB (2) 1))[ida:sa siginv(pkA)[h(NA(1)) NB (2) gXA(1) gXB(2) idb sa]] sol(h(hkb gXB (2) NB (2) h(NA(1)) ipi)) Figure 4: Attack trace reported by OFMC by OFMC; the same attack trace was reported by CL-Atse in the attack trace, fresh values are written in upper-case and are suffixed by a counter, a general convention in the model checkers that we used The identities of the honest participants are a and b instead of i and r in order to avoid confusion with the intruder which is by default i in the back-ends that we used The trace reflects the situation when the adversary forwards the message of some honest i to the responder R and gets a response that includes a puzzle built on its own ip which will be useless for i to solve The cost of the adversary is zero while the cost of i is expensive An attacker may further profit from the puzzles solved by de-ceived honest participants to perform a distributed attack on responder R while avoiding the cost of solving the puzzle on its own To overcome this, unforgeable puzzles should be used or otherwise the protocol should ensure by design that the work of some honest principals cannot be stolen by a malicious adversary, a principle also stated in All previous work on formal interpretation and modelling of resource exhaustion concerns the same kind of key agree-ment protocols and all case studies available in the cited literature are, except for the workload, very similar There-fore the same paradigm can be always employed: ensure that all values are authentic (which includes freshness), and that the client performs more work than the server (potentially adding some adjustable proof of work on the client side) However, this paradigm is not suitable for protocols of a different nature A relevant example is the well-known TESLA protocol proposed by Perrig et al , with the problem of DoS attacks considered later in This protocol is of particular interest due to its use in a constrained en-vironment (sensor networks) where even simple symmetric cryptographic primitives can become a source of resource exhaustion Therefore, in this case the usual definition of cost, that considers public primitives while symmetric prim-itives are cheap, must be changed Of particular inter-est is the attack noted in as DoS on the key chain TESLA uses an array of keys generated by the successive composition of a one-way function f over some initial key Ko, i e , f (Ko), f2 (Ko), , fi (Ko) Each new key Kncw is checked for authenticity by the receiver by verifying that f' (KNew) = KLast for some j, where KLast is the last authentic key received Now, if an adversary may mislead a receiver to believe that a key is received from a distant fu-ture, the receiver may perform too much computation which will eventually exhaust its resources The problem here is not that the keys sent by the sender are not authenticated, but that checking for authenticity becomes tedious when the keys are distant from the last known authentic key in this case, the solution is to disallow the receiver to check for more applications of the one-way function than the time elapsed from the last authentic key, divided by the disclosure delay Thus, good engineering is the solution and not a generic paradigm as was used or proposed in many key agreements protocols However, modelling a protocol such as TESLA in ASLan is not straightforward as the language does not al-low explicit definition of features such as the keychain or the time-triggered nature of the protocol The AViSPA library of protocols contains a model for TESLA, but restricted to only three rounds and too limited to check for DoS attacks 4 CONCLUSiONS Resource exhaustion is a highly relevant class of DoS at-tacks if an economic viewpoint of security protocols is con-sidered We have proposed and formalized a set of rules that can be used to automatically detect potential resource ex-haustion DoS attacks Moreover, we have provided a classifi-cation of different attack situations: excessive vs malicious protocol use depending on whether special intruder capabil-ities are needed; and intruder-controlled initiation vs one-time malicious execution, depending on whether the intruder can force a repeated attack in addition, we have character-ized the critical cases when attacks are undetectable by the honest protocol participants We have used these rules, im-plemented in the AVANTSSAR framework, and shown that this can be effective on two known representative case stud-ies, STS and JFK To the best of our knowledge this is the first formal automated analysis of DoS attacks So far, we have only modelled the computational aspect of selected cryptographic primitives, but one could easily insert cost associated to memory consumption or other re-sources As future work, we will consider assigning costs to the capabilities of the Dolev-Yao intruder; however, this would require modelling a custom intruder or changes in the model checkers We will also consider, as suggested already in , deriving the cost annotations automatically from the protocol model, which would significantly ease the usability of our approach and allow its more extensive practical use None of the previously published formal models and anal-yses use detailed algebraic costs, as Maatsura and imai have done for individual protocols indeed, to decide resource exhaustion the simple cost structure proposed by Mead-ows is sufficient However, for a more detailed analysis, automating the calculation in is a relevant future goal Acknowledgments This work is supported in part by FP7-iCT-2007-1 pro ject 216471, AVANTSSAR: Automated Validation of Trust and Security of Service-oriented Architectures 5 REFERENCES W Aiello, S M Bellovin, M Blaze, R Canetti, J ioannidis, A D Keromytis, and O Reingold Just fast keying: Key agreement in a hostile network ACM Transactions on information and System Security, 7(2):242-273, 2004 332 A Armando and L Compagna SAT-based model-checking for security protocols analysis international Journal of information Security, 7(1):3-32, 2008 T Aura, P Nikander, and J Leiwo DOS-resistant authentication with client puzzles in 8th international Workshop on Security Protocols (SP’00), LNCS vol 2133, pages 170-177 Springer, 2001 The AVANTSSAR project http:  avantssar eu  The AViSPA project http:  avispa-project org  D A Basin, S Modersheim, and L Vigano OFMC: A symbolic model checker for security protocols int’l J of information Security, 4(3):181-208, 2005 L Chen, P Morrissey, N Smart, and B Warinschi Security notions and generic constructions for client puzzles in Advances in Cryptology - ASiACRYPT, LNCS vol 5912, pages 505-523 Springer, 2009 W Diffie, P C van Oorschot, and M J Wiener Authentication and authenticated key exchanges Designs, Codes and Cryptography, 2(2):107-125, 1992 C Dwork and M Naor Pricing via processing or combatting junk mail in Advances in Cryptology: CRYPTO, LNCS vol 740, pages 139-147 Springer, 1993 R Focardi, R Gorrieri, and F Martinelli Secrecy in security protocols as non interference in DERA RHUL Workshop on Secure Architectures and information Flow, 1999 L Gong and P Syverson Fail-stop protocols: An approach to designing secure protocols in Dependable Computing for Critical Applications 5, pages 79-100, 1998 A Juels and J Brainard Client puzzles: A cryptographic countermeasure against connection depletion attacks in Network and Distributed Systems Security Symposium, pages 151-165, 1999 G Lowe Some new attacks upon security protocols in 9th iEEE Computer Security Foundations Workshop, pages 162-169, 1996 G Lowe A hierarchy of authentication specifications in 10th iEEE Computer Security Foundations Workshop, pages 31-44, 1997 W Mao and K G Paterson On the plausible deniability feature of internet protocols Published online, 2002 K Matsuura and H imai Protection of authenticated key-agreement protocol against a denial-of-service attack in international Symposium on information Theory and its Applications (iSiTA), pages 466-470, 1998 K Matsuura and H imai Modification of internet key exchange resistant against denial-of-service in Pre-Proceedings of internet Workshop (iWS 2000), pages 167-174, 2000 C Meadows A cost-based framework for analysis of denial of service in networks Journal of Computer Security, 9(1 2):143-164, 2001 A Perrig, R Canetti, D Song, and J D Tygar Efficient and secure source authentication for multicast in Network and Distributed System Security Symposium (NDSS), pages 35-46, 2001 A Perrig, R Canetti, J D Tygar, and D Song Efficient authentication and signing of multicast streams over lossy channels in iEEE Symposium on Security and Privacy, pages 56-73, 2000 V Ramachandran Analyzing DoS-resistance of protocols using a cost-based framework Technical Report DCS TR-1239, Yale University, 2002 J Smith, J M Gonzalez Nieto, and C Boyd Modelling denial of service attacks on JFK with Meadows's cost-based framework in 4th Australasian information Security Workshop, pages 125-134, 2006 D Stebila and B Ustaoglu Towards denial-of-service-resilient key agreement protocols in 14th Australasian Conference on information Security and Privacy, LNCS vol 5594, pages 389-406 Springer, 2009 Y -M Tseng Efficient authenticated key agreement protocols resistant to a denial-of-service attack international Journal of Network Management, 15(3):193-202, 2005 M Turuani The CL-Atse protocol analyser in 17th int’l Conference on Term Rewriting and Applications, LNCS vol 4098, pages 277-286 Springer, 2006 333 DocuSign Envelope iD: 6A9680AE-9BBE-4222-A40D-7A35524DF52F "Code: analysis, bugs, and security" CONDitii SPECiFiCE Concursul "Code: analysis, bugs, and security", denumit in continuare "Concursul", este oferit de BiTDEFENDER SRL, o societate cu sediul social in str Delea Veche nr 24, Cladirea de Birouri A, etaj 7, 024102 Bucharest, Romarda, inregistrata la Bucuresti, avand numar de inregistrare nr J40 20427 2005, reprezentata legal de Florin Talpes, in calitate de Director General denumita in continuare Bitdefender si se adreseaza studentilor Facultatii de AUTOMATiCa si CALCULATOARE din cadrul Universitatii POLiTEHNiCA din Timisoara A l PERiOADA CONCURSULUi Perioada de desfasurare a Concursului ("Perioada Concursului") este curpinsa intre 28 Septembrie 2017, ora 08:00 (GMT +2) si 13 ianuarie 2018, ora 16:00 (GMT +2) A 2 TERiTORiU: Timioara, Romania A3 iNSCRiERE in vederea inscrierii in Concurs, participantii vor parcurge urmatoarele etape: inscrierea la cursul Code: analysis, bugs, and security organizat de Bitdefender in cadrul facultatii de AUTOMATiCa si CALCULATOARE din cadrul Universitat ii POLiTEHNiCA din Timis oara, printr-un mail de intentie Pagina web a Concursului: http:  staff cs upt ro  marius curs bitdefender index html A 4 MECANiSMUL CONCURSULUi Din studentii inscrii la curs, 32 vor fi selectai pentru laborator Laboratorul reprezinta sesiuni practice, in care participanii isi pot dovedi competenele A 5 iNFORMAtii PRiViND PREMiiiLE Premile constau in 3 drone (quadcopter) DJi Spark Fly More Combo culoare ros ie Valoarea totala a premiilor este de aproximativ 2000 EURO A 6 ALEGEREA CasTiGaTORULUi Din cei 32 de studenti selectati pentru laborator, vor fi alesi 3 studenti pe baza evaluarii activitatii la laborator si la curs Evaluarea activitatii la laborator si curs a studentilor selectati pentru laborator va fi efectuata de catre reprezentantii Bitdefender Decizia privind alegerea celor 3 castigatori ai prezentului Concurs va avea loc in data de 22 ianuarie 2018, ora 16:00 (GMT +2) Castigatorii vor fi notificati de Bitdefender prin adresa de   utilizata pentru a participa la Concurs si, de asemenea, vor fi prezantati in curpinsul paginii web a Concursului Prezentul Regulament de Concurs este guvernat de prevederile cuprinse in "Termeni si conditii generale", disponibil in mod gratuit oricarui solicitant (si sau participant) pe pagina web a Concursului http:  staff cs upt ro  marius curs bitdefender mdex html si la sediul BiTDEFENDER in cazul in care Concursul inceteaza din cauza falsificarii sau a dificultatilor tehnice inainte de data de expirare, se va posta o notificare pe pagina web al Concursului DocuSign Envelope iD: 6A9680AE-9BBE-4222-A40D-7A35524DF52F BiTDEFENDER SRL FLORiN TALPES DiRECTOR GENERAL Liste in ML 13 octombrie 2017 3 Liste in ML O e un sir ordonat, finit, de elemente de acelasi tip in ML, putem scrie valori de tip lista incadrate intre paranteze drepte E si Zi, cu elementele separate prin punct-virgula: , [ ; ; ] 3 1 Construirea si descompunerea listelor O lista poate fi definita : e fie , fie un urmat de o in limbajele de programare, listele modeleaza cleobicei aceasta definitie: pentru a ajunge la un anumit element, lista trebuie parcursa pornind de la inceput (spre deosebire de vectori, care ofera acces direct la un element cu un anumit indice) Pentru a lucra cu liste conform acestei definitii recursive, e nevoie sa • construim o lista vida: [] (indiferent de tipul elementelor) • construim o lista clintr-o lista existenta si un nou element (care devine listei, vechea lista devenind celei noi) Aceasta se face cu : : cu sintaxa de operator binar infix: cap : : coada De exemplu, 1: : [] e lista , iar 1::2:: e lista Atentie! Operatorul : : produce o lista, nu e nevoie sa folosim paranteze drepte in jurul rezultatului Astfel 1: : inseamna pe cand ] inseamna [ ], deci o lista cu un singur element, care e la randul lui o lista de trei intregi Deasemenea, : : nu poate lega doua liste, ci doar de o lista (cu elemente de acelasi tip) : : e incorect (nu compileaza)! Exercitiul 1 Scrieti o functie care returneaza lista cifrelor unui numar natural dat ca parametru Solutie Privim numarul recursiv, ca un sir de cifre: fie o singura cifra, fie o cifra (ultima) precedata de alt numar Cum cifra pe care o extragem clintr-un numar e ultima, iar intr-o lista, elementul distinctiv e , cel mai usor e sa construim lista cifrelor in ordine inversa: n = n exprl i tipar2 -> expr2 intreaga constructie e o expresie Daca valoarea obtinuta prin evaluarea lui exprO se potriveste cu structura indicata de tipar!, valoarea intregii expresii e exprl; altfel, claca se potriveste cu structura lui tipar2, valoarea rezultanta e data de expr2, etc Bara verticala i pentru prima varianta de tipar e optionala, clar cleobicei se scrie, pentru o formatate consistenta a codului Cel mai simplu tipar e o valoare constanta: putem astfel scrie pentru negatia booleana: b = b i false -> true i true -> false Putem identifica orice alte valori structurate: perechi, n-tuple, liste, tipuri definite de utilizator Pot fi folosite doua sau mai multe tipare cu rezultat comun, separandu-le tot cu bara i a b = (a, b) i (a, 0) i (0, a) -> a i (a, b) -> cmmdc b (a mod b) in scrierea tiparelor sunt valabile urmatoarele reguli: • Pe fiecare varianta (ramura), toate numele folosite in stanga lui -> sunt identificatori nou definiti pentru a desemna partile componente ale tiparului, si domeniul lor de vizibilitate e partea dreapta (valoarea rezultanta) Chiar folosind nume existente, ele capata in cadrul tiparului un alt inteles (Mai sus, identificatorul a clin tipar e legat de o componenta a perechii, nu e parametrul functiei ) • Un identificator poate apare o singura data intr-un tipar, si se potriveste cu orice valoare (cu structura oricat de simpla complexa) • identificatorul special (linia de subliniere) e singurul care poate apare de mai multe ori intr-un tipar (fara a implica vreo egalitate intre fragmentele structurale pentru care e folosit) • Potrivirea de tipare se testeaza pe rand Deci, pentru tipare cu structura comuna, ordinea scrierii conteaza: o varianta de tipar e aplicabila doar claca nu s-au potrivit nicicare clin tiparele anterioare • Compilatorul avertizeaza claca exista variante nefolosite sau lipsa (tipare netratate), aceste verificari fiind un mare avantaj al mecanismului de potrivire de tipare (eliminand erorile la rulare) O scriere simplificata se poate folosi pentru potrivirea de tipare in argumentul unei functii: let numefct alte-arg = i tipar! -> exprl i tipar2 -> expr2 in acest caz, nu se mai da nume pentru ultimul (posibil unicul) argument al functiei, deoarece in fiecare varianta, el va fi identificat prin numele date in acele tipare De exemplu, functia semn: i 0 -> 0 i x -> x > 0 1 -1 Ordinea variantelor conteaza aici, pentru ca identificatorul x se potriveste cu orice tipar; deci, scriind in ordine inversa, si pentru valoarea 0 s-ar returna -1 (clar compilatorul avertizeaza ca tiparul 0 nu se va activa vreodata) 3 2 1 Tipare pentru liste in tiparele pentru liste, putem folosi lista vida si constructorul : : pentru liste Cel mai frecvent distingem cele doua cazuri: lista vida sau nu De exemplu, suma elementelor unei liste de intregi: i П -> 0 i h :: t -> h + sumlist t Numele h si t sunt alese de utilizator, sugerand capul listei (head) si respectiv coada (tail) Putem folosi si tipare mai complicate, de exemplu pentru a afla claca primele doua elemente sunt egale: Logica si structuri discrete Note de curs 2 Marius Minea Liste in ML 13 octombrie 2017 i el :: e2 :: when el = e2 -> true i -> false Potrivirea de tipare poate distinge doar structura unei valori (sau o constanta), si nu egalitate, deci nu se putea scrie e—н—е-нн—-—> truc (compilatorul ar fi semnalat eroare pentru folosirea unui identificator de doua ori intr-un tipar) Limbajul permite insa adaugarea unei clauze when conditie, pentru a impune conditii elementelor unui tipar Linia de subliniere e folosita pentru (sub)tiparele irelevante (coada listei, respectiv al doilea tipar, care acopera restul cazurilor: listele cu el = e2 i -> false in acest caz, primul tipar identifica listele cu > 2 elemente (cu rezultatul boolean dat de comparatie), iar al doilea tipar, restul (listele cu h = x || mem x t Functia are doi parametri, valoarea cautata (x), si lista (pe care folosim potrivirea de tipare cu ) Nu am fi putut scrie un tipar x : : t—> truc, pentru ca x clin tipar ar fi un identificator nou reprezentand capul listei, fara legatura cu parametrul x (la care atunci nu ne-arn mai putea referi) Functia mem exista si ca functie definita in modulul standard List pentru lucru cu liste 3 3 Functii predefinite pentru liste Functiile predefinite pentru liste sunt grupate in modulul List Le folosim deci cu numele complet List numefunctie (Daca am deschide modulul cu directiva open List s-ar putea folosi si numele simple, clar se prefera numele complet, pentru a fi mai clar in program unde se lucreaza cu liste ) Doua functii de baza, List hd si List tl permit obtinerea capului si cozii unei liste Daca argumentul e lista vida, ele esueaza cu o exceptie, dupa cum putem verifica in interpretorul OCarnl: List,hd П;; Exception: Failure Aceasta inseamna ca inainte de folosirea lor ar trebui sa verificam si sa tratam cazul listei vide Preferam lucrul prin potrivire de tipare, deoarece compilatorul verifica automat claca am tratat toate cazurile; el nu poate detecta insa ca nu am comparat o lista cu П inainte de a-i folosi elementele Putem implementa noi insine orice functie standard clin modulul List, pentru a intelege cum functioneaza De exemplu, functia length pentru lungimea unei liste se poate scrie recursiv: i П -> 0 i :: t -> 1 + length t Deci, List length nu e o operatie atomica, ci necesita parcurgerea intregii liste (ignorand insa valoarea elementelor, dupa cum arata folosirea lui in tipar) Va fi deci costisitoare pentru liste lungi 3 4 Recursivitatea finala (tail recursion) Am folosit recursivitatea pentru a scrie solutii cat mai simple Trebuie sa ne intrebam si cat de eficiente si utilizabile sunt functiile scrise Sa scriem progresia aritmetica cu baza 1 si ratia 2 ca sir recurent: n= n = 0 1 2 + arit (n-1) Apeland in interpretorul OCaml pe un calculator tipic arit 1000000 (un milion), obtinem: Stack overflow during evaluation (looping recursion?) Observam ca valoarea functiei se poate calcula doar dupa revenirea clin apelul recursiv arit (n-1), abia atunci se face suma cu 2 La fiecare apel recursiv, programul trebuie sa salveze in memorie locul Logica si structuri discrete Note de curs 3 Marius Minea Liste in ML 13 octombrie 2017 unde va relua calculul dupa revenirea clin apel, si orice valori (parametri, definitii locale) necesare in continuare Valorile sunt salvate intr-o zona numita stiva, deoarece ele se vor folosi clin nou in ordinea inversa in care au fost plasate in memorie (primul apel recursiv e cel clin care se revine ultimul) La un numar prea mare de apeluri, memoria clin stiva se epuizeaza, si programul esueaza Observam ca pe ramura recursiva, sigur vom aduna 2 la rezultatul apelului Putem anticipa adunarea dand functiei inca un parametru r, in care acumulam valoarea care trebuie adunata Ajunsi la cazul de baza, adunam la termenul de baza (1) valoarea acumulata (r) si obtinem rezultatul final rn= n = 0 1 + r arit2 (r + 2) (n - 1) initial, valoarea rezultatului acumulat e 0 (nu am adunat nimic) Putem scrie deci o functie aritl care apeleaza arit2 cu valoarea initiala potrivita (deci aritl va fi o functie cu un parametru): rn= n = 0 1 + r arit2 (r + 2) (n - 1) arit2 0 Pe ramura recursiva, rezultatul e returnat direct, nu mai sunt necesare alte calcule Numim situatia recursivitate finala (sau prin revenire; engl ), pentru ca apelul recursiv e ultima operatie de efectuat pe ramura respectiva Rezultatul e returnat neschimbat clin fiecare apel pana la cel initial, sau (in codul optimizat generat de compilator), chiar direct: nu mai sunt necesare informatii pe stiva (adrese de revenire, parametri sau alte valori) Recursivitatea e convertita de compilator in iteratie Rescriem asemanator lungimea listei, numarand elementele intr-un parametru acumulator: ist = r = i П -> Г i :: t -> len2 (r+1) t len2 0 ist Functia nu mai e limitata de dimensiunea stivei si poate lucra cu argumente mari 3 5 Parcurgerea cu functii standard De regula, listele trebuie parcurse, cu diverse prelucrari pe elemente Cum prelucrarile sunt functii, si intr-un limbaj functional putem transmite functii ca parametri, e natural sa folosim functii standard de parcurgere, la care trebuie doar sa specificam prelucrarea dorita Fara a mai trebui sa scriem codul de parcurgere, avem mai putin cod, mai simplu si mai usor de inteles, si cu mai putine riscuri de eroare Distingem trei mari categorii, dupa cum prelucrarea • ceva cu fiecare element, fara a returna o valoare (ex tipareste) Folosim functia List iter • fiecare element al listei, generand o noua lista de aceeasi lungime Folosim List map • valorile clin lista (de la cap sau de la coada) Folosim List f old left si List f old right 3 5 1 List iter Tipul functiei List iter e (’a -> unit) -> ’a list -> unit Aici, ’a denota o variabila de tip, care poate fi substituita cu orice tip Tipul unit e un tip cu o singura valoare, notata O E folosit pentru functiile al caror scop nu e sa produca o valoare utila, ci un , cum ar fi de exemplu functiile de tiparire (in C, functiile scrise doar pentru efectul lor, fara a returna ceva, au tipul void) List iter ia o functie cu domeniu de definitie arbitrar ’a si rezultat unit, si o lista cu acelasi tip de elemente ’a si aplica functia fiecarui element al listei Ea returneaza unit (altfel spus, nu produce un rezultat) Schematic: [ ei ; e-2 ; ••• en ] List iter Printf printf va tipari 1 2 3 cu un spatiu (indicat de formatul ) dupa fiecare numar, inclusiv ultimul List iter print int va tipari (fara spatii) 123 (print int e o functie standard cu tipul int -> unit, care tipareste un intreg) Logica si structuri discrete Note de curs 4 Marius Minea Liste in ML 13 octombrie 2017 3 5 2 List map Tipul functiei List map e (’a -> ’b) -> ’a list -> ’b list Deci, List map ia ca parametru o functie arbitrara (cu parametru de tip ’a si rezultat de tip ’b), si o lista cu elemente de tip ’a, aplicand functia fiecarui element al listei, si returnand lista rezultatelor (o lista de aceeasi lungime cu cea initiala, cu elemente de tip ’b Schematic (notand cu   functia aplicata): ei ; e-2 ; ••• en ri ; r-2 ; ••• rn Exemple: List map ( x -> x+1) da lista echivalent: List map ((+) 1) List map String length [ ; ; ] da lista (functia length clin modulul String returneaza lungimea unui sir) 3 5 3 List fold left si List fold right Functiile List ,fold left si List ,fold right sunt cele mai versatile functii pentru lucru cu liste Ele permit calculul unei valori de tip arbitrar clin toate elementele listei, pornind de la o valoare initiala si aplicand la fiecare pas o functie data elementului curent si rezultatului obtinut pana in acel moment List fold left are tipul (’a -> ’b -> ’a) -> ’a -> ’b list -> ’a, deci are trei parametri: o functie cu doi parametri, de tip ’a si ’b si rezultat de tip ’a; o valoare initiala de tip ’a, si o lista de elemente de tip ’b; rezultatul e de acelasi tip ’a ca si valoarea initiala Cu notatiile clin schema: [ ei ; 62 ; ••• en ] List fold left calculeaza succesiv valorile п =  (ro,ei), Г2 = f(ri,e-2),    , rn = en-i), rezultatul final fiind rn De exemplu, suma unei liste de numere se obtine simplu luand ca functie +, iar ca valoare initiala 0: List ,fold left (+) 0 da rezultatul 6 Cum tipul ’a ale rezultatului, valorilor initiale si intermediare nu trebuie sa fie acelasi cu tipul ’b al elementelor listei, cu List fold left se pot face prelucrari variate De exemplu, inversarea elementelor unei liste se obtine cu List fold left ( r e -> e :: г) П (aplicata listei) Functia de prelucrare ia rezultatul partial r (partea de lista inversata) si adauga elementul curent e in fata ei Astfel, dand ca valoare initiala lista vida, List ,fold left ( r e -> e::r) [] calculeaza valorile intermediare , , , returnand ultima ca rezultat Dupa cum se vede si clin tipul lui List fold left, functia data ca parametru ia ca prim argument rezultatul partial si ca al doilea argument elementul listei List fold right lucreaza asemanator, pornind insa calculul de la coada listei, si cu o ordine diferita pentru parametri (si parametrii functiei de prelucrare), dupa cum se vede clin tipul functiei: (’a -> ’b -> ’b) -> ’a list -> ’b -> ’b rn-i e", ] De exemplu, List map f ist se poate scrie List fold right ( e r -> f e : : r) ist [] List f old right nu e final-recursiva, deci e de preferat List ,fold left in exemplul de mai sus, lista ar putea fi generata si in ordine inversa cu List fold left, si apoi inversata Cand compunem mai multe prelucrari de liste, e mai citet sa folosim o notatie alternativa pentru aplicarea functiei, x |> f e echivalent cu f x, "palnia" sugererand ca x e intrare pentru f Astfel, o compunere f3 (f2 (fi x)) se poate scrie fara paranteze x |> fl | > f 2 |> f3, evidentiind ordinea in care se aplica functiile: x e argument pentru f 1, rezultatul fiind argumentul lui f2, etc De exemplu, selectam clintr-o lista numele oraselor cu cel putin 200 000 de locuitori: = [( ,159074); ( ,253200); ( ,324576); ( ,259506); ( ,290422); ( ,196367); ( ,147245); ( ,319279)] = orase |> List filter ( ( , pop) -> pop >= 200000) |> List map fst Filtrarea pune o conditie doar pentru al doilea element al perechii, primul ( ) nu conteaza Selectam apoi primul element din pereche, cu functia predefinita fst Ea s-ar putea scrie (a, ) = a Logica si structuri discrete Note de curs 5 Marius Minea Liste in ML 24 octombrie 2015 3 Liste in ML O e un sir ordonat, finit, de elemente de acelasi tip in ML, putem scrie valori de tip lista incadrate intre paranteze drepte E si Zi, cu elementele separate prin punct-virgula: , [ ; ; ] 3 1 Construirea si descompunerea listelor O lista poate fi definita : e fie , fie un urmat de o in limbajele de programare, listele modeleaza cleobicei aceasta definitie: pentru a ajunge la un anumit element, lista trebuie parcursa pornind de la inceput (spre deosebire de vectori, care ofera acces direct la un element cu un anumit indice) Pentru a lucra cu liste conform acestei definitii recursive, e nevoie sa • construim o lista vida: П (indiferent de tipul elementelor) • construim o lista clintr-o lista existenta si un nou element (care devine listei, vechea lista devenind celei noi) Aceasta se face cu : : cu sintaxa de operator binar infix: cap : : coada De exemplu, 1: : П e lista , iar 1::2:: e lista Atentie! Operatorul : : produce o lista, nu e nevoie sa folosim paranteze drepte in jurul rezultatului Astfel 1: : inseamna pe cand ] inseamna [ ], deci o lista cu un singur element, care e la randul lui o lista de trei intregi Deasemenea, : : nu poate lega doua liste, ci doar de o lista (cu elemente de acelasi tip) : : e incorect (nu compileaza)! Exercitiul 1 Scrieti o functie care returneaza lista cifrelor unui numar natural dat ca parametru Solutie Privim numarul recursiv, ca un sir de cifre: fie o singura cifra, fie o cifra (ultima) precedata de alt numar Cum cifra pe care o extragem clintr-un numar e ultima, iar intr-o lista, elementul distinctiv e , cel mai usor e sa construim lista cifrelor in ordine inversa: n = n exprl i tipar2 -> expr2 intreaga constructie e o expresie Daca valoarea obtinuta prin evaluarea lui exprO se potriveste cu structura indicata de tipari, valoarea intregii expresii e exprl; altfel, claca se potriveste cu structura lui tipar2, valoarea rezultanta e data de expr2, etc Bara verticala i pentru prima varianta de tipar e optionala, clar cleobicei se scrie, pentru o formatate consistenta a codului Cel mai simplu tipar e o valoare constanta: putem astfel scrie pentru negatia booleana: b = b i false -> true i true -> false Putem identifica orice alte valori structurate: perechi, n-tuple, liste, tipuri definite de utilizator Pot fi folosite doua sau mai multe tipare cu rezultat comun, separandu-le tot cu bara i a b = (a, b) i (a, 0) i (0, a) -> a i (a, b) -> cmmdc b (a mod b) in scrierea tiparelor sunt valabile urmatoarele reguli: • Pe fiecare varianta (ramura), toate numele folosite in stanga lui -> sunt identificatori nou definiti pentru a desemna partile componente ale tiparului, si domeniul lor de vizibilitate e partea dreapta (valoarea rezultanta) Chiar folosind nume existente, ele capata in cadrul tiparului un alt inteles (Mai sus, identificatorul a clin tipar e legat de o componenta a perechii, nu e parametrul functiei ) • Un identificator poate apare o singura data intr-un tipar, si se potriveste cu orice valoare (cu structura oricat de simpla complexa) • identificatorul special (linia de subliniere) e singurul care poate apare de mai multe ori intr-un tipar (fara a implica vreo egalitate intre fragmentele structurale pentru care e folosit) • Potrivirea de tipare se testeaza pe rand Deci, pentru tipare cu structura comuna, ordinea scrierii conteaza: o varianta de tipar e aplicabila doar claca nu s-au potrivit nicicare clin tiparele anterioare • Compilatorul avertizeaza claca exista variante nefolosite sau lipsa (tipare netratate), aceste verificari fiind un mare avantaj al mecanismului de potrivire de tipare (eliminand erorile la rulare) O scriere simplificata se poate folosi pentru potrivirea de tipare in argumentul unei functii: let numefct alte-arg = i tipar! -> exprl i tipar2 -> expr2 in acest caz, nu se mai da nume pentru ultimul (posibil unicul) argument al functiei, deoarece in fiecare varianta, el va fi identificat prin numele date in acele tipare De exemplu, functia semn: i 0 -> 0 i x -> x > 0 1 -1 Ordinea variantelor conteaza aici, pentru ca identificatorul x se potriveste cu orice tipar; deci, scriind in ordine inversa, si pentru valoarea 0 s-ar returna -1 (clar compilatorul avertizeaza ca tiparul 0 nu se va activa vreodata) Logica si structuri discrete Note de curs 2 Marius Minea Liste in ML 24 octombrie 2015 3 2 1 Tipare pentru liste in tiparele pentru liste, putem folosi lista vida si constructorul : : pentru liste Cel mai frecvent distingem cele doua cazuri: lista vida sau nu De exemplu, suma elementelor unei liste de intregi: i П -> 0 i h :: t -> h + sumlist t Numele h si t sunt alese de utilizator, sugerand capul listei (head) si respectiv coada (tail) Putem folosi si tipare mai complicate, de exemplu pentru a afla claca primele doua elemente sunt egale: i el :: e2 :: when el = e2 -> true i -> false Potrivirea de tipare poate distinge doar structura unei valori (sau o constanta), si nu egalitate, deci nu se putea scrie e—ее—e—ее—-—> true (compilatorul ar fi semnalat eroare pentru folosirea unui identificator de doua ori intr-un tipar) Limbajul permite insa adaugarea unei clauze when conditie, pentru a impune conditii elementelor unui tipar Linia de subliniere e folosita pentru (sub)tiparele irelevante (coada listei, respectiv al doilea tipar, care acopera restul cazurilor: listele cu el = e2 i -> false in acest caz, primul tipar identifica listele cu > 2 elemente (cu rezultatul boolean dat de comparatie), iar al doilea tipar, restul (listele cu h = x || mem x t Functia are doi parametri, valoarea cautata (x), si lista (pe care folosim potrivirea de tipare cu ) Nu am fi putut scrie un tipar x : : t—> true, pentru ca x clin tipar ar fi un identificator nou reprezentand capul listei, fara legatura cu parametrul x (la care atunci nu ne-arn mai putea referi) Functia mem exista si ca functie definita in modulul standard List pentru lucru cu liste 3 3 Functii predefinite pentru liste Functiile predefinite pentru liste sunt grupate in modulul List Le folosim deci cu numele complet List numefunctie (Daca am deschide modulul cu directiva open List s-ar putea folosi si numele simple, clar se prefera numele complet, pentru a fi mai clar in program unde se lucreaza cu liste ) Doua functii de baza, List hd si List tl permit obtinerea capului si cozii unei liste Daca argumentul e lista vida, ele esueaza cu o exceptie, dupa cum putem verifica in interpretorul OCarnl: List,hd П;; Exception: Failure Aceasta inseamna ca inainte de folosirea lor ar trebui sa verificam si sa tratam cazul listei vide Preferam lucrul prin potrivire de tipare, deoarece compilatorul verifica automat claca am tratat toate cazurile; el nu poate detecta insa ca nu am comparat o lista cu П inainte de a-i folosi elementele Putem implementa noi insine orice functie standard clin modulul List, pentru a intelege cum functioneaza De exemplu, functia length pentru lungimea unei liste se poate scrie recursiv: i П -> 0 i :: t -> 1 + length t Deci, List length nu e o operatie atomica, ci necesita parcurgerea intregii liste (ignorand insa valoarea elementelor, dupa cum arata folosirea lui in tipar) Va fi deci costisitoare pentru liste lungi Logica si structuri discrete Note de curs 3 Marius Minea Liste in ML 24 octombrie 2015 3 4 Recursivitatea finala (tail recursion) Am folosit, recursivitatea pentru a scrie solutii cat mai simple Trebuie sa ne intrebam si cat de eficiente si utilizabile sunt functiile scrise Sa scriem progresia aritmetica cu baza 1 si ratia 2 ca sir recurent: n= n = 0 1 2 + arit (n-1) Apeland in interpretorul OCaml pe un calculator tipic arit 1000000 (un milion), obtinem: Stack overflow during evaluation (looping recursion?) Observam ca valoarea functiei se poate calcula doar dupa revenirea clin apelul recursiv arit (n-1), abia atunci se face suma cu 2 La fiecare apel recursiv, programul trebuie sa salveze in memorie locul unde va relua calculul dupa revenirea clin apel, si orice valori (parametri, definitii locale) necesare in continuare Valorile sunt salvate intr-o zona numita stiva, deoarece ele se vor folosi clin nou in ordinea inversa in care au fost plasate in memorie (primul apel recursiv e cel clin care se revine ultimul) La un numar prea mare de apeluri, memoria clin stiva se epuizeaza, si programul esueaza Observam ca pe ramura recursiva, sigur vom aduna 2 la rezultatul apelului Putem anticipa adunarea dand functiei inca un parametru r, in care acumulam valoarea care trebuie adunata Ajunsi la cazul de baza, adunam la termenul de baza (1) valoarea acumulata (r) si obtinem rezultatul final rn= n = 0 1 + r arit2 (r + 2) (n - 1) initial, valoarea rezultatului acumulat e 0 (nu am adunat nimic) Putem scrie deci o functie aritl care apeleaza arit2 cu valoarea initiala potrivita (deci aritl va fi o functie cu un parametru): rn= n = 0 1 + r arit2 (r + 2) (n - 1) arit2 0 Pe ramura recursiva, rezultatul e returnat direct, nu mai sunt necesare alte calcule Numim situatia recursivitate finala (sau prin revenire; engl ), pentru ca apelul recursiv e ultima operatie de efectuat pe ramura respectiva Rezultatul e returnat neschimbat clin fiecare apel pana la cel initial, sau (in codul optimizat generat de compilator), chiar direct: nu mai sunt necesare informatii pe stiva (adrese de revenire, parametri sau alte valori) Recursivitatea e convertita de compilator in iteratie Rescriem asemanator lungimea listei, numarand elementele intr-un parametru acumulator: ist = r = i П -> Г i :: t -> len2 (r+1) t len2 0 ist Functia nu mai e limitata de dimensiunea stivei si poate lucra cu argumente mari 3 5 Parcurgerea cu functii standard De regula, listele trebuie parcurse, cu diverse prelucrari pe elemente Cum prelucrarile sunt functii, si intr-un limbaj functional putem transmite functii ca parametri, e natural sa folosim functii standard de parcurgere, la care trebuie doar sa specificam prelucrarea dorita Fara a mai trebui sa scriem codul de parcurgere, avem mai putin cod, mai simplu si mai usor de inteles, si cu mai putine riscuri de eroare Distingem trei mari categorii, dupa cum prelucrarea • ceva cu fiecare element, fara a returna o valoare (ex tipareste) Folosim functia List iter • fiecare element al listei, generand o noua lista de aceeasi lungime Folosim List map • valorile clin lista (de la cap sau de la coada) Folosim List f old left si List f old right 3 5 1 List iter Tipul functiei List iter e (’a -> unit) -> ’a list -> unit Aici, ’a denota o variabila de tip, care poate fi substituita cu orice tip Tipul unit e un tip cu o singura valoare, notata O E folosit pentru functiile al caror scop nu e sa produca o valoare utila, ci un , cum ar fi de exemplu functiile de tiparire (in C, functiile scrise doar pentru efectul lor, fara a returna ceva, au tipul void) List iter ia o functie cu domeniu de definitie arbitrar ’a si rezultat unit, si o lista cu acelasi tip de elemente ’a si aplica functia fiecarui element al listei Ea returneaza unit (altfel spus, nu produce un rezultat) Logica si structuri discrete Note de curs 4 Marius Minea Liste in ML 24 octombrie 2015 Schematic: [ ei ; e-2 ; ••• en ] List iter Printf printf va tipari 1 2 3 cu un spatiu (indicat de formatul ) dupa fiecare numar, inclusiv ultimul List iter print int va tipari (fara spatii) 123 (print int e o functie standard cu tipul int -> unit, care tipareste un intreg) 3 5 2 List map Tipul functiei List map e (’a -> ’b) -> ’a list -> ’b list Deci, List map ia ca parametru o functie arbitrara (cu parametru de tip ’a si rezultat de tip ’b), si o lista cu elemente de tip ’a, aplicand functia fiecarui element al listei, si returnand lista rezultatelor (o lista de aceeasi lungime cu cea initiala, cu elemente de tip ’b Schematic (notand cu   functia aplicata): [ ei ; e-2 ; ••• en ] [ D ; r2 ; ••• rn ] Spre exemplu, List map ( x -> x+1) sau, echivalent, List map ((+) 1) produce lista List map String length [ ; ; ] produce lista (functia length clin modulul String returneaza lungimea unui sir) 3 5 3 List fold left si List fold right Functiile List ,fold left si List ,fold right sunt cele mai versatile functii pentru lucru cu liste Ele permit calculul unei valori de tip arbitrar clin toate elementele listei, pornind de la o valoare initiala si aplicand la fiecare pas o functie data elementului curent si rezultatului obtinut pana in acel moment List fold left are tipul (’a -> ’b -> ’a) -> ’a -> ’b list -> ’a, deci are trei parametri: o functie cu doi parametri, de tip ’a si ’b si rezultat de tip ’a; o valoare initiala de tip ’a, si o lista de elemente de tip ’b; rezultatul e de acelasi tip ’a ca si valoarea initiala Cu notatiile clin schema: [ ei ; 62 ; ••• en ]   - r'2 - in-l -   List ,fold left calculeaza succesiv valorile п =  (ro,ei), Г2 = f(ri,62),    , rn = en-i), rezultatul final fiind rn De exemplu, suma unei liste de numere se obtine simplu luand ca functie +, iar ca valoare initiala 0: List ,fold left (+) 0 da rezultatul 6 Cum tipul ’a ale rezultatului, valorilor initiale si intermediare nu trebuie sa fie acelasi cu tipul ’b al elementelor listei, cu List fold left se pot face prelucrari variate De exemplu, inversarea elementelor unei liste se obtine cu List ,fold left ( r e -> e :: г) П (aplicata listei) Functia de prelucrare ia rezultatul partial r (partea de lista inversata) si adauga elementul curent e in fata ei Astfel, dand ca valoare initiala lista vida, List ,fold left ( r e -> e::r) [] calculeaza valorile intermediare , , , returnand ultima ca rezultat Dupa cum se vede si clin tipul lui List f old left, functia data ca parametru ia ca prim argument rezultatul partial si ca al doilea argument elementul listei vede clin tipul functiei: List fold right lucreaza asemanator, pornind insa calculul de la coada listei, si cu o ordine diferita pentru parametri (si parametrii functiei de prelucrare), dupa cum [ ei ; e2 ; (’a -> ’b -> ’b) -> ’a list -> ’b -> ’b se -> f e : : r) ist [] • De exemplu, List map f ist se poate scrie List fold right ( e List f old right nu e final-recursiva, deci e de preferat List ,fold left in exemplul de mai sus, lista ar putea fi generata si in ordine inversa cu List fold left, si apoi inversata Logica si structuri discrete Note de curs 5 Marius Minea Multimi in ML 15 octombrie 2017 4 Multimi in ML O e o colectie neordonata de elemente de acelasi tip Pentru liste de orice tip am folosit aceleasi functii clin modulul List (spunem ca sunt polimorfe, functioneaza la fel indiferent de tip; mai precis, avem polimorfism parametric, tipul ’a list fiind parametrizat cu tipul (arbitrar) ’a al elementelor) Pentru multimi, trebuie sa specificam intai tipul elementelor cu care dorim sa lucram, si sa cream un modul De exemplu, pentru multimi de siruri: module S = Set Маке(String) dupa care putem folosi functiile prefixate cu numele (ales de noi, aici S) al modulului, de exemplu S add, S isempty, S union Atentie! Spre deosebire de liste, nu putem folosi numele functiilor precedate de Set (Sot add, etc ) in definitia mai sus, String (cu litera mare) e tot un , continand o colectie de functii care lucreaza cu tipul string (cu litera mica) Set Маке e o functie care ia ca parametru un modul (String) si produce un alt modul (pe care l-am numit S) O astfel de functie pe module se numeste -nu detaliem aici sistemul de module clin OCarnl Putem defini multimi cu orice tip de elemente, claca intai avem un modul cu anumite caracteristici: un tip t si o functie totala de peste elementele tipului De exemplu, putem defini modulul module int = struct t = int = compare si apoi modulul module iS = Set Маке (int) Modulul Char pentru tipul char e preclefinit, int nu Ca functie de comparare am ales functia standard compare clin modulul de baza Pervasives, care e deschis automat (putem deci numi functiile simplu, fara prefix) Ea are tipul ’a -> ’a -> int, deci poate compara elemente de tip arbitrar, returnand 0 claca sunt egale, negativ claca primul e considerat mai mic, si pozitiv claca primul e mai mare (ca si diferenta dintre numere) Pentru tipuri structurate, ea e definita sa compare intai prima componenta clin cele doua valori, iar claca sunt egale a doua, etc Cerintele pentru un modul care poate fi folosit ca parametru pentru Set Маке (un tip t si o functie compare: t -> t -> int) formeaza o de tip ( ) sau interfata Daca declaram in interpretor un modul multime: module CS = Set Маке (Char) vor fi listate toate tipurile si functiile clin modul, si care formeaza semnatura (interfata) modulului, de exemplu: module CS: sig elt = Char t t = Set Маке(Char),t val empty : t val is empty : t -> bool val mem : elt -> t -> bool val add : elt -> t -> t val singleton : elt -> t Sunt definite numele elt pentru tipul elementelor, si t pentru tipul multime (de elemente de tip elt) Vedem ca functia add ia un element x si o multime A si returneaza o multime, A U {ж} Subliniem ca (la fel ca toate operatiile in stil functional), functia add multime, ci returneaza o valoare obtinuta clin acea multime prin adaugarea unui nou element Valori de tip multime Spre deosebire de liste, ML nu are o notatie speciala pentru valori de tip multime Putem construi o multime pornind de la constanta empty (multimea vida cu tipul dat de modul), si functia add, de exemplu CS add ’a’ (CS add ’b’ (CS add ’c’ CS empty)), sau CS add ’a’ (CS add ’c’ (CS singleton ’b’)), unde singleton creeaza o multime cu un element Multimile nefiind ordonate, nu conteaza ordinea in care adaugam elementele in scrierile de mai sus incepand cu OCarnl 4 01 putem scrie mai scurt cu operatorul i > (aplicare de la stanga la dreapta): x |> f |> g inseamna g (f x) : CS (empty |> add ’a’ |> add ’b’ |> add ’c’) Logica si structuri discrete Note de curs 1 Marius Minea Multimi in ML 15 octombrie 2017 4 1 Construirea unei multimi dintr-o lista Exercitiul 1 Scrieti o functie cu argument, lista de intregi care returneaza multimea intregilor clin lista Pentru inceput, definim modulele necesare pentru o lista de intregi: module int = struct t = int = compare module iS = Set Маке(int) incepand cu OCarnl 4 02, modulul Set are functia of list care ia o lista si returneaza multimea elementelor ei: iS of list Discutam cum se poate implementa aceasta functie Putem scrie functia direct recursiv, folosind obisnuita potrivire de tipare pentru liste: i П iS empty i h :: t -> iS add h (set of intlist t) Functia e simpla clar are problema tipica scrierii in care rezultatul apelului recursiv (multimea elementelor clin coada listei, set of intlist t) e folosita mai departe intr-o operatie (se adauga capul listei la multime): nu e final recursiva, si pentru liste lungi va esua prin depasirea stivei Pentru transformarea in functie final recursiva (tail recursive) folosim obisnuita tehnica de a acumula rezultatul partial intr-un parametru suplimentar, actualizat inaintea apelului recursiv, si pentru functia dorita, o apelam cu multimea vida ca valoare initiala pentru acumulator: ist = res = i П res i h : : t -> set of il2 (iS add h res) t set of il2 iS empty ist Aceasta prelucrare cu acumulator o face si functia List fold left Mai sus, un pas de prelucrare porneste de la rezultatul partial res si un element (aici h, capul listei) si produce noul rezultat partial iS add h res Pentru a face acelasi lucru cu List fold left avem nevoie de o functie care exprima acest pas de prelucrare: res e -> iS add e res Putem scrie atunci, echivalent: ist = List fold left ( res e -> iS add e res) iS empty ist Apeland in interpretor = set of intlist nu se va vizualiza multimea s, deoarece nu e definita o modalitate standard de afisare pentru obiecte compuse arbitrare Putem insa verifica evaluand iS elements s, care ne arata , functia elements returnand lista elementelor multimii, crescator in ordinea definita de functia compare specificata pentru tipul elementelor 4 2 Parcurgerea multimilor Nefiind ordonata, o multime nu are un element special cum e capul unei liste Majoritatea parcurgerilor pe multimi se scriu uniform folosind functia f old, asemanatoare ca functie celor intalnite la liste Tipul ei este (elt -> ’a -> ’a) -> t -> ’a -> ’a Ea ia deci trei parametri Primul e o functie cu doi parametri: un element al multimii, si rezultatul acumulat (de tip arbitrar), returnand un rezultat de acelasi tip Al parametru al lui fold e multimea pe care se aplica, si al treilea e valoarea initiala a acumulatorului (de acelasi tip ca si rezultatul final) Parametrii corespund ca ordine si tip celor clin List fold right Documentatia precizeaza ca elementele sunt parcurse in ordine crescatoare, clar aceasta e o particularitate de implementare; adesea, rezultatul nu depinde de ordine Acelasi principiu de parcurgere se intalneste pentru tipurile colectie (lista, multime, tablou) in multe alte limbaje Prelucrarea se face ca in figura, reamintind ca primul parametru al lui   vine de sus (elementul), si al doilea e acumulatorul: { ei ; e-2 ; ••• en } —   П   - r2 - r" i Logica si structuri discrete Note de curs 2 Marius Minea Multimi in ML 15 octombrie 2017 Parcurgerile s-ar putea scrie si explicit recursiv, pornind de la un element dat de functiile min elt, max elt, sau choose (oarecare), si continuand cu multimea obtinuta prin eliminarea elementului (remove) Deobicei, scrierea (si citirea) codului e mai greoaie, deci preferam parcurgerea cu fold Ca exemplu, rescriem cateva functii standard clin modulul Set Nu are sens sa facem aceasta intr-un program - ele exista si le folosim - clar putem ilustra cateva parcugeri cu rezultate simple Presupunem declarat modulul module S = Set Маке (String) sl s2 = S fold ( e s -> S add e s) sl s2 Functia union parcurge multimea sl (al doilea argument al lui S fold) pornind cu valoarea initiala s2 (al doilea argument) si la fiecare pas de parcurgere (functia data ca prim argument) adauga la acumulator (initial s2) un element clin multimea parcursa (sl) stiind ca f = g claca si numai claca f x = g x pentru orice argument, observam ca paranteza de mai sus inseamna de fapt S add, si la fel, nu mai sunt necesare argumentele sl si s2 in ambele parti Obtinem astfel forma extrem de concisa = S fold S add ceea ce e ne indica faptul ca fold e o functie extrem de puternica si utila Asemanator, putem scrie: sl s2 = S fold ( e s -> S remove e s) s2 sl Pentru intersectie, pasul de parcurgere e diferit: pornind de la multimea vida, parcurgem o multime si adaugam doar elementele care se afla in cealalta: sl s2 = S fold ( e r -> S mem e s2 S add e r r) sl S empty si pentru functii cu rezultat boolean putem scrie o implemetare cu fold: acumulatorul e raspunsul (adevarat sau fals) obtinut pana in momentul curent Pornim cu raspunsul true, care poate deveni fals in orice pas claca elementul curent (clin sl) nu e membru in s2 sl s2 = S fold ( e r -> r && S mem e s2) sl true Din logica functiei e evident ca odata fals, rezultatul partial nu mai poate deveni adevarat Vom discuta in alt curs cum prelucrarea poate fi intrerupta aici folosind 4 3 Produsul cartezian Pentru a calcula produsul cartezian A x B, va trebui sa scriem clin nou module si functii particularizate pentru tipurile A si B De exemplu, pentru perechi de intregi si caractere: module int = struct t = int = compare module Sl = Set Маке(int) module S2 = Set Маке(Char) module iCPair = struct t = int * char = compare module PS = Set Маке(iCPair) Notiunea de produs cartezian e folosita si in limbajul ML pentru definirea de tipuri compuse, cum e tipul int * char de perechi de intregi si caractere Putem privi produsul cartezian ca o matrice, in care pe linii variaza primul element iar pe coloane al doilea Mai intai parcurgem prima multime, pastrand un element fix b clin a doua, generand (si adaugand la rezultatul cu valoare initiala r) toate perechile variind elementul сц clin prima sl b r = Sl fold ( el r -> PS add (el, b) r) sl r sau, contractand prin eliminarea lui r de ambele parti: sl b = Sl fold ( el -> PS add (el, b)) sl Apoi, parcurgem s2, aplicand pentru fiecare element functia pairwith, pornind de la multimea vida: sl s2 = S2 fold ( e r -> pairwith sl e r) s2 PS empty sau simplificat: sl s2 = S2 fold (pairwith sl) s2 PS empty Vizualizam clin nou ca lista, folsind functia elements: cartprod Sl (singleton 1 |> add 2 |> add 3) S2 (singleton ’a’ |> add ’b’) |> PS elements [(1, ’a’); (1, ’b’); (2, ’a’); (2, ’b’); (3, ’a’); (3, ’b’)] Logica si structuri discrete Note de curs 3 Marius Minea Multimi in ML 24 octombrie 2015 4 Multimi in ML O e o colectie neordonata de elemente de acelasi tip Pentru liste de orice tip am folosit aceleasi functii clin modulul List (spunem ca sunt polimorfe, functioneaza la fel indiferent de tip; mai precis, avem polimorfism parametric, tipul ’a list fiind parametrizat cu tipul (arbitrar) ’a al elementelor) Pentru multimi, trebuie sa specificam intai tipul elementelor cu care dorim sa lucram, si sa cream un modul De exemplu, pentru multimi de siruri: module S = Set Маке(String) dupa care putem folosi functiile prefixate cu numele (ales de noi, aici S) al modulului, de exemplu S add, S isempty, S union Atentie! Spre deosebire de liste, nu putem folosi numele functiilor precedate de Set (Sot add, etc ) in definitia mai sus, String (cu litera mare) e tot un , continand o colectie de functii care lucreaza cu tipul string (cu litera mica) Set Маке e o functie care ia ca parametru un modul (String) si produce un alt modul (pe care l-am numit S) O astfel de functie pe module se numeste -nu detaliem aici sistemul de module clin OCarnl Putem defini multimi cu orice tip de elemente, claca intai avem un modul cu anumite caracteristici: un tip t si o functie totala de peste elementele tipului De exemplu, putem defini modulul module int = struct t = int = compare si apoi modulul module iS = Set Маке (int) Modulul Char pentru tipul char e preclefinit, int nu Ca functie de comparare am ales functia standard compare clin modulul de baza Pervasives, care e deschis automat (putem deci numi functiile simplu, fara prefix) Ea are tipul ’a -> ’a -> int, deci poate compara elemente de tip arbitrar, returnand 0 claca sunt egale, negativ claca primul e considerat mai mic, si pozitiv claca primul e mai mare (ca si diferenta dintre numere) Pentru tipuri structurate, ea e definita sa compare intai prima componenta clin cele doua valori, iar claca sunt egale a doua, etc Cerintele pentru un modul care poate fi folosit ca parametru pentru Set Маке (un tip t si o functie compare: t -> t -> int) formeaza o de tip ( ) sau interfata Daca declaram in interpretor un modul multime: module CS = Set Маке (Char) vor fi listate toate tipurile si functiile clin modul, si care formeaza semnatura (interfata) modulului, de exemplu: module CS: sig elt = Char t t = Set Маке(Char),t val empty : t val is empty : t -> bool val mem : elt -> t -> bool val add : elt -> t -> t val singleton : elt -> t Sunt definite numele elt pentru tipul elementelor, si t pentru tipul multime (de elemente de tip elt) Vedem ca functia add ia un element x si o multime A si returneaza o multime, A U {ж} Subliniem ca (la fel ca toate operatiile in stil functional), functia add multime, ci returneaza o valoare obtinuta clin acea multime prin adaugarea unui nou element Valori de tip multime Spre deosebire de liste, ML nu are o notatie speciala pentru valori de tip multime Putem construi o multime pornind de la constanta empty (multimea vida cu tipul dat de modul), si functia add, de exemplu CS add ’a’ (CS add ’b’ (CS add ’c’ CS empty)), sau CS add ’a’ (CS add ’c’ (CS singleton ’b’)), unde singleton creeaza o multime cu un element Multimile nefiind ordonate, nu conteaza ordinea in care adaugam elementele in scrierile de mai sus incepand cu OCarnl 4 01 putem scrie mai scurt cu operatorul i > (aplicare de la stanga la dreapta): x |> f |> g inseamna g (f x) : CS (empty |> add ’a’ |> add ’b’ |> add ’c’) Logica si structuri discrete Note de curs 1 Marius Minea Multimi in ML 24 octombrie 2015 4 1 Construirea unei multimi dintr-o lista Exercitiul 1 Scrieti o functie cu argument, lista de intregi care returneaza multimea intregilor clin lista Pentru inceput, definim modulele necesare pentru o lista de intregi: module int = struct t = int = compare module iS = Set Маке(int) incepand cu OCarnl 4 02, modulul Set are functia of list care ia o lista si returneaza multimea elementelor ei: iS of list Discutam cum se poate implementa aceasta functie Putem scrie functia direct recursiv, folosind obisnuita potrivire de tipare pentru liste: i П iS empty i h :: t -> iS add h (set of intlist t) Functia e simpla clar are problema tipica scrierii in care rezultatul apelului recursiv (multimea elementelor clin coada listei, set of intlist t) e folosita mai departe intr-o operatie (se adauga capul listei la multime): nu e final recursiva, si pentru liste lungi va esua prin depasirea stivei Pentru transformarea in functie final recursiva (tail recursive) folosim obisnuita tehnica de a acumula rezultatul partial intr-un parametru suplimentar, actualizat inaintea apelului recursiv, si pentru functia dorita, o apelam cu multimea vida ca valoare initiala pentru acumulator: ist = res = i П res i h : : t -> set of il2 (iS add h res) t set of il2 iS empty ist Aceasta prelucrare cu acumulator o face si functia List fold left Mai sus, un pas de prelucrare porneste de la rezultatul partial res si un element (aici h, capul listei) si produce noul rezultat partial iS add h res Pentru a face acelasi lucru cu List fold left avem nevoie de o functie care exprima acest pas de prelucrare: res e -> iS add e res Putem scrie atunci, echivalent: ist = List fold left ( res e -> iS add e res) iS empty ist Apeland in interpretor = set of intlist nu se va vizualiza multimea s, deoarece nu e definita o modalitate standard de afisare pentru obiecte compuse arbitrare Putem insa verifica evaluand iS elements s, care ne arata , functia elements returnand lista elementelor multimii, crescator in ordinea definita de functia compare specificata pentru tipul elementelor 4 2 Parcurgerea multimilor Nefiind ordonata, o multime nu are un element special cum e capul unei liste Majoritatea parcurgerilor pe multimi se scriu uniform folosind functia f old, asemanatoare ca functie celor intalnite la liste Tipul ei este (elt -> ’a -> ’a) -> t -> ’a -> ’a Ea ia deci trei parametri Primul e o functie cu doi parametri: un element al multimii, si rezultatul acumulat (de tip arbitrar), returnand un rezultat de acelasi tip Al parametru al lui fold e multimea pe care se aplica, si al treilea e valoarea initiala a acumulatorului (de acelasi tip ca si rezultatul final) Parametrii corespund ca ordine si tip celor clin List f old right Documentatia precizeaza ca elementele sunt parcurse in ordine crescatoare, clar aceasta e o particularitate de implementare; adesea, rezultatul nu depinde de ordine Acelasi principiu de parcurgere se intalneste pentru tipurile colectie (lista, multime, tablou) in multe alte limbaje Prelucrarea se face ca in figura, reamintind ca primul parametru al lui   vine de sus (elementul), si al doilea e acumulatorul: { ei ; e-2 ; ••• en } —   П   - r2 - r" i Logica si structuri discrete Note de curs 2 Marius Minea Multimi in ML 24 octombrie 2015 Parcurgerile s-ar putea scrie si explicit recursiv, pornind de la un element dat de functiile min elt, max elt, sau choose (oarecare), si continuand cu multimea obtinuta prin eliminarea elementului (remove) Deobicei, scrierea (si citirea) codului e mai greoaie, deci preferam parcurgerea cu fold Ca exemplu, rescriem cateva functii standard clin modulul Set Nu are sens sa facem aceasta intr-un program - ele exista si le folosim - clar putem ilustra cateva parcugeri cu rezultate simple Presupunem declarat modulul module S = Set Маке (String) sl s2 = S fold ( e s -> S add e s) sl s2 Functia union parcurge multimea sl (al doilea argument al lui S fold) pornind cu valoarea initiala s2 (al doilea argument) si la fiecare pas de parcurgere (functia data ca prim argument) adauga la acumulator (initial s2) un element clin multimea parcursa (sl) stiind ca f = g claca si numai claca f x = g x pentru orice argument, observam ca paranteza de mai sus inseamna de fapt S add, si la fel, nu mai sunt necesare argumentele sl si s2 in ambele parti Obtinem astfel forma extrem de concisa = S fold S add ceea ce e ne indica faptul ca fold e o functie extrem de puternica si utila Asemanator, putem scrie: sl s2 = S fold ( e s -> S remove e s) s2 sl Pentru intersectie, pasul de parcurgere e diferit: pornind de la multimea vida, parcurgem o multime si adaugam doar elementele care se afla in cealalta: sl s2 = S fold ( e r -> S mem e s2 S add e r r) sl S empty si pentru functii cu rezultat boolean putem scrie o implemetare cu fold: acumulatorul e raspunsul (adevarat sau fals) obtinut pana in momentul curent Pornim cu raspunsul true, care poate deveni fals in orice pas claca elementul curent (clin sl) nu e membru in s2 sl s2 = S fold ( e r -> r && S mem e s2) sl true Din logica functiei e evident ca odata fals, rezultatul partial nu mai poate deveni adevarat Vom discuta in alt curs cum prelucrarea poate fi intrerupta aici folosind 4 3 Produsul cartezian Pentru a calcula produsul cartezian A x B, va trebui sa scriem clin nou module si functii particularizate pentru tipurile A si B De exemplu, pentru perechi de intregi si caractere: module int = struct t = int = compare module Sl = Set Маке(int) module S2 = Set Маке(Char) module iCPair = struct t = int * char = compare module PS = Set Маке(iCPair) Notiunea de produs cartezian e folosita si in limbajul ML pentru definirea de tipuri compuse, cum e tipul int * char de perechi de intregi si caractere Putem vedea produsul cartezian ca o matrice, in care pe linii variaza primul element iar pe coloane al doilea Mai intai parcurgem prima multime, pastrand un element fix b clin a doua, generand (si adaugand la rezultatul cu valoare initiala r) toate perechile variind elementul сц clin prima sl b r = Sl fold ( el r -> PS add (el, b) r) sl r sau, contractand prin eliminarea lui r de ambele parti: sl b = Sl fold ( el -> PS add (el, b)) sl Apoi, parcurgem s2, aplicand pentru fiecare element functia addpairs, pornind de la multimea vida: sl s2 = S2 fold ( e r -> addpairs sl e r) s2 PS empty sau simplificat: sl s2 = S2 fold (addpairs sl) s2 PS empty Vizualizam clin nou ca lista, folsind functia elements: PS elements (cartprod (Sl add 1 (Sl add 2 (Sl singleton 3))) (S2 add ’a’ (S2 singleton ’b’))) [(1, ’a’); (1, ’b’); (2, ’a’); (2, ’b’); (3, ’a’); (3, ’b’)] Logica si structuri discrete Note de curs 3 Marius Minea Asocieri (dictionare) in ML 24 octombrie 2017 5 Asocieri (dictionare) in ML Putem modela asocieri sau functii partiale cu modulul asociere (Map), prin care unora clin valorile unui tip numit conventional cheie (key) le sunt asociate valori clintr-un tip numit domeniu (sau tip valoare) Tipul asociere se mai numeste dictionar, deoarece pentru fiecare cheie contine definitia (valoarea) sa Map defineste deci o functie partiala de pe tipul cheie pe tipul valoare Putem folosi asocierile si pentru relatii arbitrare intre A si B, tinand cont ca la un element clin A corespunde in general o multime de elemente clin В - folosim deci chei de tip A si valori multimi de elemente de tip B Ca si pentru multimi, e necesar sa avem un modul care stabileste o relatie de ordine pe tipul cheie (Map nu impune constrangeri tipului valoare) De exemplu, cream un modul Map cu chei de tip sir: module M = Map Маке(String) Ca pentru orice colectie, avem nevoie de cea mai simpla valoare, asocierea vida, scrisa M empty Putem crea asocieri arbitrare adaugand pe rand elemente: unul = M add 5 M empty sau mai multe: = M empty |> M add 5 |> M add 3 Functia add ia o cheie к, o valoare v si o asociere m si creeaza o alta asociere cu acelasi continut ca si cea data m, clar care asociaza lui к valoarea v Orice asociere anterioara a lui к (claca exista) nu se pastreaza in rezultat Subliniem ca add nu modifica asocierea initiala (conform cu modul de programare functional), ci creeaza o alta asociere Modulul declarat M poate fi folosit in acelasi program pentru a crea mai multe asocieri cu tipuri distincte de valori, insa fiecare asociere individuala poate avea un singur tip de valoare De exemplu, la asocierile m sau m2 de mai sus putem adauga mai departe doar chei sir cu valori intregi, clar am putea crea alta asociere: = M singleton unde valorile sunt si ele siruri Functia singleton e o varianta simpla de a crea o asociere cu o singura pereche, aici ( , ) Asocierile sunt obiecte abstracte care nu sunt vizualizate implicit de interpretor Putem transforma un dictionar intr-o lista de asociere (lista de perechi cheie-valoare) cu functia bindings: M bindings m2 returneaza lista [( , 5); ( , 3)] Fiind o lista, ea e vizualizata implicit de interpretor Opusul lui add e functia remove (de cheie si dictionar) care creeaza un nou dictionar cu toate asocierile clin cel dat, mai putin cea pentru cheia precizata = M remove m2 produce un dictionar cu unica asociere ( ,3) Similar cu diferenta intre multimi, incercarea de a elimina o cheie inexistenta nu are niciun efect: = M remove m2 |> M bindings produce lista [( , 5); ( , 3)] Principalul scop al dictionarelor e de a regasi (eficient) valoarea asociata cu o cheie Pentru aceasta folosim functia find: M find m va returna valoarea 5 5 1 Lucrul cu exceptii in ML Daca incercam sa cautam o cheie inexistenta intr-o asociere, se genereaza o exceptie: M find (M singleton 5) Exception: Not found M singleton creeaza o asociere cu o singura pereche cheie-valoare, deci nu exista asociere pentru Exceptiile sunt un mecanism software prin care se semnaleaza (dupa cum sugereaza numele) conditii exceptionale care trebuie tratate (argument invalid, impartire la zero, eroare la citire, etc ) Distingem doua aspecte: exceptiilor si lor Am vazut deja functii standard care genereaza exceptii, cum ar fi List ,hd si List tl cu lista vida, in functii scrise de noi putem genera o exceptie apeland functia raise exceptie in ML, exceptiile sunt si ele valori fac parte clintr-un tip special exn Sunt preclefinite cateva exceptii: Not found (folosita de functiile de cautare), Failure cu un sir (mesaj de eroare) pentru functii care esueaza, nefiind definite pentru argumentele date - de exemplu List nth 5 si invalid argument tot cu un sir pentru a semnala argumente nepotrivite (care nu au sens), cum ar fi List nth (-1) Pentru ultimele doua exista functiile preclefinite failwith echivalenta cu raise (Failure ) si invalid arg echivalenta cu raise (invalid argument ) Cand o functie genereaza o exceptie, executia ei se incheie fara a returna o valoare Fluxul de control (executia normala) al programului se modifica si exceptia se propaga in sus la functia apelanta, de acolo la functia care a apelat-o pe aceasta, etc Daca undeva in codul care a apelat functia care Logica si structuri discrete Note de curs 1 Marius Minea Asocieri (dictionare) in ML 24 octombrie 2017 a provocat exceptia e prevazut cod pentru tratarea exceptiei respective, executia continua cu acel fragment de cod Altfel, executia intregului program e abandonata (ca in exemplul cu M find) in ML, tratarea exceptiilor se face cu constructia expresie in care poate aparea o exceptie tipar pentru tratarea exceptiilor Orice expresie (fragment de program) in care poate aparea o exceptie trebuie inclusa intr-un , altfel, la aparitia exceptiei, netratate, intreg programul va fi abandonat Potrivirea de tipare dupa are sintaxa deja intalnita tipar! -> exprl i tiparS -> expr2 etc unde tipar!, tiparS etc se potrivesc cu exceptii Pentru a scrie tratarea exceptiilor, trebuie sa stim deci ce exceptii pot fi generate de functiile folosite Cautarea intr-o asociere genereaza exceptia Not f ound Putem scrie deci o functie: к m = M find к m Not found -> 0 care cauta o cheie intr-un dictionar cu valori intregi, si returneaza 0 claca cheia nu e gasita (Dictionarul trebuie sa aiba valori intregi, deoarece o functie trebuie sa returneze intotdeauna acelasi tip) Exceptiile sunt produse de operatii sau functii standard, sau le putem genera noi, cu functia raise Exceptiile sunt variante ale tipului special exn si numele de exceptii sunt constructori (cu sau fara argumente), deci sunt scrise cu majuscula Exceptia Exit e preclefinita pentru a fi folosita de utilizator De exemplu, putem scrie functia de test de membru intr-o lista folosind o parcurgere standard, pe care o intrerupem cand elementul a fost gasit: x ist = List iter ( e -> x = e raise Exit) ist; false Exit -> true Pe fiecare element al listei e aplicata functia clin paranteza, care genereaza o exceptie claca elementul curent e cel cautat Daca elementul nu exista in lista, nu se genereaza nicio exceptie, List iter se termina normal, si valoarea clin e cea a ultimei expresii, false Altfel, se genereaza exceptia Exit, care e tratata in partea de , cu rezultatul true Putem defini exceptii proprii care au si argumente si putem transmite astfel informatie utila (chiar rezultate) spre locul de tratare a exceptiei De exemplu, vrem sa calculam suma tuturor numerelor pozitive clintr-o lista pana la aparitia primului numar negativ sau nul Putem scrie Exclntreg int ist = List fold left ( re-> e>0 r+e raise (Exclntreg r)) 0 ist Exclntreg r -> r Apeland pospart obtinem valoarea 6 Aceasta ne da posibilitatea de a continua sa folosim parcurgerile standard (mai ales pentru liste si dictionare care nu identifica un "prim" element anume) si sa intrerupem parcurgerea in momentul in care avem rezultatul 5 2 Crearea unui dictionar dintr-o lista de asociere Sa construim acum un dictionar pornind de la o lista de asociere (lista de perechi) Ne fixam clin nou siruri ca tip de cheie module M = Мар Маке(String) ist = List fold left ( m (a, b) -> M add a b m) M empty ist = map of assoc [( , 3); ( , 17); ( , 7); ( , 5)] Putem examina apoi M bindings m, cu rezultatul [( ,17);( ,5);( ,7)] Functia folosita cu List ,fold left preia la fiecare pas un rezultat partial care e un dictionar si o pereche (cheie, valoare) clin lista, si creeaza un nou dictionar care contine perechea ca noua asociere O noua asociere la aceeasi cheie o suprascrie pe prima - in final, cheia are valoarea 5 si nu 3 Logica si structuri discrete Note de curs 2 Marius Minea Asocieri (dictionare) in ML 24 octombrie 2017 5 3 Relatii ca dictionare cu valori de tip multime Sa implementam acum o relatie care poate asocia unei chei mai multe valori - vom stoca deci in dictionar un tip multime Cand adaugam o noua pereche (cheie, valoare) trebuie sa obtinem intai vechea multime de valori asociata cheii Daca dictionarul nu contine cheia, multimea de valori asociata acesteia e vida Scriem o functie care trateaza si cazul de exceptie, presupunand multimi de intregi: module S = Set Маке(struct t = int = compare ) m к = M find к m Not found -> S empty Am presupus ca avem un modul M pentru dictionar si altul S pentru multimi cu tipul dorit de valori Scriem acum o functie care creeaza un dictionar clintr-o lista de asocieri (perechi) unde fiecare cheie ar putea sa apara de mai multe ori Parcurgem lista cu List fold left, acumuland la fiecare pas noul dictionar Functia de actualizare (pe care o numim addpair) obtine intai cu find e valoarea (aici: o multime de valori) asociata cheii a (primul element clin pereche), adauga la ea al doilea element clin pereche (b) si asociaza noua multime cu a Adaugarea incepe de la asocierea vida M empty ist = m (a, b) = M add a (find e m a |> S add b) m List fold left addpair M empty ist Putem crea atunci dictionarul dorit apeland = setmap of assoc [( , 3); ( , 6); ( , 1); ( , 5)] Pentru a vizualiza in interpretor dictionarul, putem obtine lista de asocieri folosind M bindings Al doilea element al fiecarei perechi e o multime; putem sa o transformam in lista, care poate fi afisata: M bindings m |> List map ( (a, b) -> (a, S elements b)) - : (M key * S elt list) list = [( , ); ( , ); ( , )] Remarcam ca are asociate doua valori, 5 si 6 Sau, putem scrie direct functii de tiparire, intai pentru multimi si apoi pentru dictionar: open Printf s = print char ’ s <> S empty ( = S min elt s print int el; S iter (printf ) (S remove el s) ); print char m = M iter ( к v -> printf k; print set v) m Parcurgerea cu M iter are nevoie de o functie de doi parametri, cheie si valoare Se va afisa x -> {3} у -> {5, 6} z -> -fi} 5 4 inchiderea tranzitiva a unei relatii Pentru o relatie binara pe o multime, putem calcula inchiderea tranzitiva a relatiei De exemplu, pentru multimea A = {a, b, c, d} si relatia R = {ta, b), tb, c), (c, d), tb, a)}, obtinem:  i2 = {ta, a), ta, c), tb, b), tb, d)} si R U R2 = {ta, a), ta, b), ta, c), tb, a), tb, b), tb, c), tb, d), tc, di)} Ri3 = {ta, b), ta, di), tb, a ), tb, c)},  iU R2 U Ri3 = {(a, a), ta, b), ta, c), ta, di), tb, a ), tb, b)tb, c), tb, di), tc, di)} si apoi puterile superioare nu mai adauga alte perechi noi Presupunem ca avem acelasi tip pentru cheie si elementele multimii valoare, de exemplu module M = Мар Маке(Char) module S = Set Маке(Char) Logica si structuri discrete Note de curs 3 Marius Minea Asocieri (dictionare) in ML 24 octombrie 2017 Privim relatia ca functie cu valori in multimea partilor,  д(ж) = {у | R(x,y)} in exemplul nostru, fp = {a i-> {b}, b i-> {а, с}, c >-> {d}, d >-> {}}, reprezentand-o explicit prin perechi Calculam apoi relatia Ry = RuR2 Putem scrie  д12(ж) =  я(ж) иееул(т)  д(е): de la x parcurgem relatia o data cu  я(ж) sau de doua ori - inca o data pentru fiecare element clin multimea fpfx) Obtinem deci  я12(ж) = {a {a,b,c},b {a,b,c,d},c {d},d {}} Data fiind o functie   : A —> P(A), vrem o functie care pentru o multime s sa calculeze s Uees  (e) Facem aceasta prin parcurgere cu S fold: pentru fiecare element e, reunim f e cu multimea deja acumulata, pornind de la s f s = S fold ( e r -> S union (f e) r) s s sau, simplificand r de ambele parti si scriind cu |> (aplicarea inversa): f s = S fold ( e -> f e |> S union) s s Cu   = fp si s = {a, c}, add image f s ar da {a, c} U fp(a) U fp(c) = {a, c} U {b} U {d} = {a, b, c, d} in implementarea noastra, relatia R e dictionarul m, si functia fp e find e m, care clin cheia x ne da multimea s = find e m x, adica fp(x') Apoi, add image (find e m) s ne da s Ue s fp(e), adica  я12(ж) Deci, obtinem  r12(x) in doi pasi: o mapare s = find e m x folosind dictionarul m, apoi aplicand la s functia add image (find e m) Am reusit sa exprimam astfel Я12 tot ca dictionar El poate fi obtinut clin m cu functia standard M map care transforma un dictionar in alt dictionar cu aceleasi chei, data fiind functia care transforma prima valoare in a doua - aici, add image (f ind e m) m = M map (add image (find e m)) m inchiderea tranzitiva se poate calcula aplicand add sqr pana la punct fix, pentru ca la fiecare pas, numarul maxim de aplicari al relatiei se dubleaza Ramane sa scriem functia de punct fix tinem cont ca dictionarele nu se pot compara cu =, fiindca asocieri egale pot avea reprezentari structural diferite Parametrizam deci functia de punct fix cu o functie de comparatie eq in cazul de fata, folosim functia M equal, unde primul parametru e functia de comparatie pentru valori Acestea sunt multimi, deci si pentru ele folosim functia equal, cu modulele noastre, S equal: eq f = x = = f x eq x у x fixl у fixl m = fix (M equal S equal) (add sqr m) m Construimm = M setmap of assoc [(’a’, ’b’); (’b’, ’c’); (’c’, ’d’); (’b’, ’a’)],siapoi tiparim M transclose m (de exemplu cu functia print map anterior definita) Obtinem rezultatul calculat manual la inceputul sectiunii 5 5 Citirea de la intrare cu scanf (optional) Cand scriem programe care citesc de la intrare, e preferabil sa le rulam clin interpretorul lansat in terminal, sau si mai bine, de sine statator, clin terminal, compiland intai cu ocamlc program ml si apoi ruland , a out (sau , ain Windows) Daca rulam clin Emacs, caracterele ;; pe care le introducem la sfarsit pot fi interpretate nedorit ca facand parte clin textul dat la intrare Functia cea mai versatila pentru citire in OCarnl e scanf Daca o folosim in mod repetat, e util sa deschidem modulul respectiv: open Scanf Functia scanf ia doi parametri: un sir de format, si o functie care va fi apelata pe valorile citite; rezultatul eidevine si rezultatul apelului la scanf sirul de format are un rol similar celui clin C: specificatorii de format care incep cu % precizeaza ce se doreste citit: %s (sir), ° "c ( caracter), ° "d (intreg), %f (real) Un caracter obisnuit in sirul de format trebuie sa se regaseasca in intrare pentru ca citirea sa aibe succes Spre deosebire de C, la citirea formatelor sir si numerice nu se consuma spatiile albe initiale Pentru aceasta, precedati %d, %s, etc cu un spatiu in sirul de format; aceasta produce citirea si ignorarea oricator caractere de tip spatiu alb (spatiu, tab, linie noua, etc ) Putem citi un sir dand functia identitate ca parametrul 2: = scanf ( x -> x) Pentru a tipari direct sirul citit putem scrie: scanf pr int st ring Functia data ca parametru la scanf trebuie sa aibe atatia parametri cate elemente sunt citite Pentru a citi doua numere, a le calcula si afisa suma: print int (scanf (+)) Citirea unui sir ° "s produce intotdeauna o valoare; ea este sirul vid claca la intrare nu urmeaza un Logica si structuri discrete Note de curs 4 Marius Minea Asocieri (dictionare) in ML 24 octombrie 2017 sir (caractere diferite de spatii), sau s-a ajuns la sfarsitul intrarii Putem scrie atunci o functie care citeste si tipareste toate sirurile citite de la intrare: claca sirul citit e nevid, functia il tipareste si se reapeleaza recursiv, altfel nu face nimic O = scanf ( s -> s <> (printf s; allstrings ())) Dupa acelasi principiu, e util sa scriem o functie care citeste siruri de la intrare, si le aplica succesiv o prelucrare a carei rezultat e acumulat, similar cu List fold left, doar ca lista e implicita, data de succesiunea sirurilor in intrare: f r = scanf ( s-> s = r frs|> scanfold s f) Daca citirea sirului esueaza (sirul vid), se returneaza rezultatul r Altfel, se aplica functia f rezultatului acumulat r si sirului citit s, si functia e apelata recursiv cu noul rezultat partial Cum parametrul f nu se schimba, putem rescrie cu o functie ajutatoare de un singur parametru: f = r = scanf ( s-> s = r frs|> scan2) scan2 De exemplu, putem calcula si afisa suma lungimilor tuturor sirurilor clin intrare (excluzand spatiile): scanfold s ( r s -> r + String length s) 0 i > print int (pornind de la valoarea 0) Revenind la folosirea dictionarelor, putem calcula numarul de aparitii ale fiecarui cuvant (sir) clintr-un text citit de la intrare Pentru aceasta, actualizam la fiecare pas un dictionar cu numarul de aparitii Se cauta intai sirul citit in dictionar, obtinand contorul curent (sau 0 in caz de exceptie, cuvant negasit) Apoi se creeaza un dictionar nou, cu contorul pentru acel sir incrementat cu 1 module M = Мар Маке(String) m s = = M find s m Not found -> 0 M add s (cnt+1) m = scanfold s addcnt M empty = M iter (printf ) m Spre deosebire de siruri, pentru valori numerice scanf genereaza exceptii claca citirea esueaza: exceptia Scan failure (cu un mesaj ca parametru), sau exceptia End of f ile Pentru a citi succesiv numere, etc, prelucrarea e similara clar trebuie sa tratam aceste exceptii Logica si structuri discrete Note de curs 5 Marius Minea Asocieri (dictionare) in ML 1 noiembrie 2015 5 Asocieri (dictionare) in ML Putem modela relatiile cu ajutorul modulului asociere (Map), prin care unora clin valorile unui tip numit conventional cheie (key) le sunt asociate valori clintr-un tip numit domeniu (sau tip valoare) Tipul asociere se mai numeste dictionar, deoarece pentru fiecare cheie contine definitia (valoarea) sa Map defineste deci o functie partiala de pe tipul cheie pe tipul valoare Putem reprezenta relatii arbitrare intre multimile A si В claca alegem ca si tip valoare multimi cu elemente de tip B Ca si pentru multimi, e necesar sa avem un modul care stabileste o relatie de ordine pe tipul cheie (Map nu impune constrangeri tipului valoare) De exemplu, cream un modul Map cu chei de tip sir: module M = Map Маке(String) Putem scrie apoi = M add 5 M empty Functia add ia o cheie к, o valoare v si o asociere m si creeaza o alta asociere cu acelasi continut ca si cea data m, clar care asociaza lui к valoarea v Orice asociere anterioara a lui к (claca exista) nu se pastreaza in rezultat De subliniat ca add nu modifica asocierea initiala (conform cu modul de programare functional), ci creeaza o alta asociere Valoarea M empty reprezinta asocierea vida (cu cheie string, clar fara vreun tip valoare precizat) Modulul declarat M poate fi folosit in acelasi program pentru a crea mai multe asocieri cu domenii distincte, insa fiecare asociere poate avea un singur domeniu (tip valoare) De exemplu, la valoarea m declarata mai sus putem adauga mai departe doar chei sir cu valori intregi Pentru a regasi o valoare intr-o asociere, folosim functia find M find m va returna valoarea 5 Asocierile sunt obiecte compuse (abstracte) care nu sunt vizualizate implicit de interpretor Putem transforma un dictionar intr-o lista de asociere (lista de perechi cheie-valoare) cu functia bindings: M bindings m returneaza lista [( , 5)] Putem tipari o asociere prin parcurgere cu functia M iter 5 1 Lucrul cu exceptii in ML Daca incercam sa cautam o cheie inexistenta intr-o asociere, se genereaza o exceptie: M find (M singleton 5) Exception: Not found M singleton creeaza o asociere cu o singura pereche cheie-valoare, deci nu exista asociere pentru Exceptiile sunt un mecanism software prin care se semnaleaza (dupa cum sugereaza numele) conditii exceptionale care trebuie tratate (argument invalid, impartire la zero, eroare la citire, etc ) Distingem doua aspecte: exceptiilor si lor Am vazut deja functii standard care genereaza exceptii, cum ar fi List ,hd si List tl cu lista vida, in functii scrise de noi putem genera o exceptie apeland functia raise exceptie in ML, exceptiile sunt si ele valori fac parte clintr-un tip special exn Sunt predefinite cateva exceptii: Not found (folosita de functiile de cautare), Failure cu un sir (mesaj de eroare) pentru functii care esueaza, nefiind definite pentru argumentele date - de exemplu List nth 5 si invalid argument tot cu un sir pentru a semnala argumente nepotrivite (care nu au sens), cum ar fi List nth (-1) Pentru ultimele doua exista functiile predefinite failwith echivalenta cu raise (Failure ) si invalid arg echivalenta cu raise (invalid argument ) Cand o functie genereaza o exceptie, executia ei se incheie fara a returna o valoare Fluxul de control (executia normala) al programului se modifica si exceptia se propaga in sus la functia apelanta, de acolo la functia care a apelat-o pe aceasta, etc Daca undeva in codul care a apelat functia care a provocat exceptia e prevazut cod pentru tratarea exceptiei respective, executia continua cu acel fragment de cod Altfel, executia intregului program e abandonata (ca in exemplul cu M find) in ML, tratarea exceptiilor se face cu constructia expresie in care poate aparea o exceptie tipar pentru tratarea exceptiilor Orice expresie (fragment de program) in care poate aparea o exceptie trebuie inclusa intr-un , altfel, la aparitia exceptiei, netratate, intreg programul va fi abandonat Potrivirea de tipare dupa are sintaxa deja intalnita tipar! -> exprl i tiparS -> expr2 etc unde tipar!, tiparS etc se potrivesc cu exceptii Pentru a scrie tratarea exceptiilor, trebuie sa stim deci Logica si structuri discrete Note de curs 1 Marius Minea Asocieri (dictionare) in ML 1 noiembrie 2015 ce exceptii pot fi generate de functiile folosite Cautarea intr-o asociere genereaza exceptia Not f ound Putem scrie deci o functie: к m = M find к m Not found -> 0 care cauta o cheie intr-un dictionar cu valori intregi, si returneaza 0 claca cheia nu e gasita (Dictionarul trebuie sa aiba valori intregi, deoarece o functie trebuie sa returneze intotdeauna acelasi tip) Exceptiile sunt produse de operatii sau functii standard, sau le putem genera noi, cu functia raise Exceptiile sunt variante ale tipului special exn si numele de exceptii sunt constructori (cu sau fara argumente), deci sunt scrise cu majuscula Exceptia Exit e preclefinita pentru a fi folosita de utilizator De exemplu, putem scrie functia de test de membru intr-o lista folosind o parcurgere standard, pe care o intrerupem cand elementul a fost gasit: x ist = List iter ( e -> x = e raise Exit) ist; false Exit -> true Pe fiecare element al listei e aplicata functia clin paranteza, care genereaza o exceptie claca elementul curent e cel cautat Daca elementul nu exista in lista, nu se genereaza nicio exceptie, List iter se termina normal, si valoarea clin e cea a ultimei expresii, false Altfel, se genereaza exceptia Exit, care e tratata in partea de , cu rezultatul true Putem defini exceptii proprii care au si argumente si putem transmite astfel informatie utila (chiar rezultate) spre locul de tratare a exceptiei De exemplu, vrem sa calculam suma tuturor numerelor pozitive clintr-o lista pana la aparitia primului numar negativ sau nul Putem scrie Exclntreg int ist = List fold left ( re-> e>0 r+e raise (Exclntreg r)) 0 ist Exclntreg r -> r Apeland pospart obtinem valoarea 6 Aceasta ne da posibilitatea de a continua sa folosim parcurgerile standard (mai ales pentru liste si dictionare care nu identifica un "prim" element anume) si sa intrerupem parcurgerea in momentul in care avem rezultatul 5 2 Crearea unui dictionar dintr-o lista de asociere Sa construim acum un dictionar pornind de la o lista de asociere (lista de perechi) Ne fixam clin nou siruri ca tip de cheie module M = Мар Маке(String) ist = List fold left ( m (a, b) -> M add a b m) M empty ist = map of assoc [( , 3); ( , 17); ( , 7); ( , 5)1 Putem examina apoi M bindings m, cu rezultatul [( ,17);( ,5);( ,7)1 Functia folosita cu List ,fold left preia la fiecare pas un rezultat partial care e un dictionar si o pereche (cheie, valoare) clin lista, si creeaza un nou dictionar care contine perechea ca noua asociere O noua asociere la aceeasi cheie o suprascrie pe prima - in final, cheia are valoarea 5 si nu 3 5 3 Relatii ca dictionare cu valori de tip multime Sa implementam acum o relatie care poate asocia unei chei mai multe valori - vom stoca deci in dictionar un tip multime Cand adaugam o noua pereche (cheie, valoare) trebuie sa obtinem intai vechea multime de valori asociata cheii Daca dictionarul nu contine cheia, multimea de valori asociata acesteia e vida Scriem o functie care trateaza si cazul de exceptie: m к = M find к m Not found -> S empty Logica si structuri discrete Note de curs 2 Marius Minea Asocieri (dictionare) in ML 1 noiembrie 2015 Am presupus ca avem un modul M pentru dictionar si altul S pentru multimi cu tipul dorit de valori Scriem acum o functie care creeaza un dictionar clintr-o lista de asocieri (perechi) unde fiecare cheie ar putea sa apara de mai multe ori Parcurgem lista cu List fold left, acumuland la fiecare pas noul dictionar Functia de actualizare (pe care o numim addpair) obtine intai cu get valoarea (aici: o multime de valori) asociata cheii a (primul element clin pereche), adauga la ea al doilea element clin pereche (b) si asociaza noua multime cu a Adaugarea incepe de la asocierea vida M empty ist = m (a, b) = M add a (S add b (get m a)) m List fold left addpair M empty ist Pentru o solutie cat mai generala, scriem un modul (functor) parametrizat cu module pentru tipul cheie si tipul element de multime, module SetMap(Key: Map OrderedType)(Val: Set OrderedType) = struct module M = Map Маке(Key) include M module S = Set Маке(Val) m к = M find к m Not found -> S empty ist = m (x, y) = M add x (S add у (get m x)) m List fold left addpair M empty ist instantiem acum un astfel de modul, dupa ce definim obisnuitul modul pentru intregi: module int = struct t = int = compare module SM = SetMap(String)(int) Sintagma include M clin modulul SetMap ne permite sa folosim direct functii cu numele SM add, SM find, etc , in loc de SM M add, SM M find, etc ele fiind de fapt functii clin modulul M declarat in SetMap Spre comparatie, pentru functiile de multimi trebuie sa scriem SM S elements, etc Putem crea atunci dictionarul dorit apeland = (SM setmap of assoc [( , 3); ( , 6); ( , 1); ( , 5)]) Pentru a vizualiza in interpretor dictionarul, putem obtine lista de asocieri folosind SM bindings Al doilea element al fiecarei perechi e o multime; putem sa o transformam in lista, care poate fi afisata: List map ( (a, b) -> (a, SM S elements b)) (SM bindings m) - : (SM key * SM S elt list) list = [( , ); ( , ); ( , )] Remarcam ca are asociate doua valori, 5 si 6 Sau, putem scrie direct functii de tiparire, intai pentru multimi si apoi pentru dictionar: s = print char ’ s <> SM S empty ( = SM S min elt s print int el; SM S iter (Printf printf ) (SM S remove el s)) print char m = SM iter ( к v -> Printf printf k; print set v) m Parcurgerea cu SM iter are nevoie de o functie de doi parametri, cheie si valoare Se va afisa x -> {3} у -> -fi} Aceste functii se puteau scrie si in modulul SetMap, devenind parte clin el si fiind disponibile pentru fiecare instantiere a modulului 5 4 inchiderea tranzitiva a unei relatii Pentru o relatie binara pe o multime, putem calcula inchiderea tranzitiva a relatiei De exemplu, pentru multimea A = {a, b, c, d} si relatia R = {(a, b), (a, c), (c, d), (a, a)}, obtinem:  i2 = {(a, a), (a, c), (&, b), (&, d)} si R U R2 = {(a, a), (a, b), (a, c), (&, a), (&, b), (&, c), (&, d), (c, d)} Д3 = {(a, &)> (a, d), (&, a), (&, c)},  iu R2 U  i3 = {(a, a), (a, &), (a, c), (a, d), (&, a), (&, &)(&, c), (&, d), (c, d)} si apoi puterile superioare nu mai adauga alte perechi noi Logica si structuri discrete Note de curs 3 Marius Minea Asocieri (dictionare) in ML 1 noiembrie 2015 Particularizam modulul SetMap cu acelasi tip pentru cheie si elementele multimii-valoare: module BinRel(0rd: Map OrderedType) = struct module SM = SetMap(Ord)(Ord) include SM Vom privi relatia ca functie cu valori in multimea partilor,  д(ж) = {у | R(x,y)} in exemplul nostru, fp = {a i-> {&},&>-" {a,c},ci-> {d},d >-> {}}, reprezentand-o explicit prin perechi Calculam apoi relatia R12 = R U R2 Putem scrie  r12( t) = fp(x') иееуд(т)  д(е): de la x parcurgem relatia o data cu fp(x) sau de doua ori - inca o data pentru fiecare element clin multimea fp(x) Obtinem deci  я12(ж) = {a {a,b,c},b^ {a,b,c,d},c^ {d},d^ {}} Data fiind o functie   : A —> P(A), vrem o functie care pentru o multime s sa calculeze s Uees  (e) Facem aceasta prin parcurgere cu S fold: pentru fiecare element e, reunim f e cu multimea deja acumulata, pornind de la s f s = S fold ( e r -> S union (f e) r) s s sau, folosind compunerea f g x = f (g x): f s = S fold (comp S union f) s s in implementarea noastra, relatia R e dictionarul m, si functia fp e get m, care clin cheia x ne da multimea s = get m x, adica fpfx) Apoi, add image (get m) s ne da s Uees fp(e'), adica fp12(x') Deci, obtinem  r12( t) in doi pasi: o mapare s = get m x folosind dictionarul m, apoi aplicand la s functia add image (get m) Am reusit sa exprimam astfel Я12 tot ca dictionar El poate fi obtinut clin m cu functia standard SM map care transforma un dictionar in alt dictionar cu aceleasi chei, data fiind functia care transforma prima valoare in a doua - aici, add image (get m) m = SM map (add image (get m)) m inchiderea tranzitiva se poate calcula aplicand add sqr pana la punct fix, pentru ca la fiecare pas, numarul maxim de aplicari al relatiei se dubleaza Ramane sa scriem functia de punct fix tinem cont ca dictionarele nu se pot compara cu =, fiindca asocieri egale pot avea reprezentari structural diferite Parametrizam deci functia de punct fix cu o functie de comparatie eq in cazul de fata, folosim functia SM equal, unde primul parametru e functia de comparatie pentru valori Acestea sunt multimi, deci si pentru ele folosim functia equal, cu modulele noastre, SM S equal: eq f = x = = f x eq x у x fixl у fixl m = fix (SM equal SM S equal) (add sqr m) m Construim m = M setmap of assoc [(’a’, ’b’); (’b’, ’c’); (’c’, ’d’); (’b’, ’a’)],dupa ce am creat module M = BinRel(Char), si apoi tiparim M transclose m (de exemplu cu functia print map anterior definita) Obtinem rezultatul calculat manual la inceputul sectiunii 5 5 Citirea de la intrare cu scanf Cand scriem programe care citesc de la intrare, e preferabil sa le rulam clin interpretorul lansat in terminal, sau si mai bine, de sine statator, clin terminal, compiland intai cu ocamlc program ml si apoi ruland , a out (sau , ain Windows) Daca rulam clin Emacs, caracterele ;; pe care le introducem la sfarsit pot fi interpretate nedorit ca facand parte clin textul dat la intrare Functia cea mai versatila pentru citire in OCarnl e scanf Daca o folosim in mod repetat, e util sa deschidem modulul respectiv: open Scanf Functia scanf ia doi parametri: un sir de format, si o functie care va fi apelata pe valorile citite; rezultatul eidevine si rezultatul apelului la scanf sirul de format are un rol similar celui clin C: specificatorii de format care incep cu % precizeaza ce se doreste citit: %s (sir), ° "c ( caracter), ° "d (intreg), %f (real) Un caracter obisnuit in sirul de format trebuie sa se regaseasca in intrare pentru ca citirea sa aibe succes Spre deosebire de C, la citirea formatelor sir si numerice nu se consuma spatiile albe initiale Pentru aceasta, precedati %d, %s, etc cu un spatiu in sirul de format; aceasta produce citirea si ignorarea oricator caractere de tip spatiu alb (spatiu, tab, linie noua, etc ) Logica si structuri discrete Note de curs 4 Marius Minea Asocieri (dictionare) in ML 1 noiembrie 2015 Putem citi un sir dand functia identitate ca parametrul 2: = scanf ( x -> x) Pentru a tipari direct sirul citit putem scrie: scanf pr int st ring Functia data ca parametru la scanf trebuie sa aibe atatia parametri cate elemente sunt citite Pentru a citi doua numere, a le calcula si afisa suma: print int (scanf (+)) Citirea unui sir ° "s produce intotdeauna o valoare; ea este sirul vid claca la intrare nu urmeaza un sir (caractere diferite de spatii), sau s-a ajuns la sfarsitul intrarii Putem scrie atunci o functie care citeste si tipareste toate sirurile citite de la intrare: claca sirul citit e nevid, functia il tipareste si se reapeleaza recursiv, altfel nu face nimic O = scanf ( s -> s <> (printf s; allstrings ())) Dupa acelasi principiu, e util sa scriem o functie care citeste siruri de la intrare, si le aplica succesiv o prelucrare a carei rezultat e acumulat, similar cu List fold left, doar ca lista e implicita, data de succesiunea sirurilor in intrare: f r = scanf ( s -> s = r scanfold s f (f r s)) Daca citirea sirului esueaza (sirul vid), se returneaza rezultatul r Altfel, se aplica functia f rezultatului acumulat r si sirului citit s, si functia e apelata recursiv cu noul rezultat partial Cum parametrul f nu se schimba, putem rescrie cu o functie ajutatoare de un singur parametru: f = r = scanf ( s -> s = r scan2 (f r s)) scan2 De exemplu, putem calcula si afisa suma lungimilor tuturor sirurilor clin intrare (excluzand spatiile): print int (scanfold s ( r s -> r + String length s) 0) (pornind de la valoarea 0) Revenind la folosirea dictionarelor, putem calcula numarul de aparitii ale fiecarui cuvant (sir) clintr-un text citit de la intrare Pentru aceasta, actualizam la fiecare pas un dictionar cu numarul de aparitii Se cauta intai sirul citit in dictionar, obtinand contorul curent (sau 0 in caz de exceptie, cuvant negasit) Apoi se creeaza un dictionar nou, cu contorul pentru acel sir incrementat cu 1 module M = Мар Маке(String) = scanfold s ( m s -> = M find s m Not found -> 0 M add s (cnt+1) m) M empty = M iter (printf ) m Spre deosebire de siruri, pentru valori numerice scanf genereaza exceptii claca citirea esueaza: exceptia Scan failure (cu un mesaj ca parametru), sau exceptia End of file Pentru a scrie o functie similara cu scanf old s pentru valori numerice, trebuie sa tratam aceste exceptii fmt f = r = ( = scanf fmt (f r) () -> scanfold2 rl End of file | Scan failure -> () -> r) () scanfold2 Functia are ca parametru si formatul fmt pentru scanf in primul rand, se incearca citirea conform formatului; in caz de succes, scanf transmite valorile citite (formatul poate specifica mai multe) ca argumente la functia f r (f aplicata partial pe primul argument, care e rezultatul acumulat); scanf va returna valoarea produsa de f, notata cu rl Ramura de prelucrare normala cat si cea de exceptie produc o functie () -> de argument unit ("fara argumente"), care e apelata () in final Pe ramura de exceptie, functia returneaza valoarea r, calculul fiind incheiat Altfel, se apeleaza recursiv scanf old2 cu noul rezultat Codul a fost scris in acest fel pentru ca eventuala tratare a exceptiei sa se faca inaintea apelului recursiv, care ramane ultima operatie - deci functia este final recursiva (tail recursive) si va putea trata un sir oricat de lung de date de intrare Ca exemplu simplu de folosire, putem scrie print int (scanfold (+) 0), care va citi si aduna toate numerele (separate prin spatii) citite de la intrare, afisand in final rezultatul Logica si structuri discrete Note de curs 5 Marius Minea The Verus Tool: A Quantitative Approach to the Formal Verification of Real-Time Systems1 Sergio Campos, Edmund Clarke and Marius Minea Carnegie Mellon University campos@cs cmu edu, emc@cs cmu edu and marius@cs cmu edu 1 introduction The task of checking if a computer system satisfies its timing specifications is extremely important These Systems are often used in criticai applications where failure to meet a deadline can have serious or even fatal consequences This work describes Verus, an efficient tool for performing this verification task Using our tool, the system being verified is specified in the Verus language and then compiled into a state-transition graph A symbolic model checker allows the verification of untimed properties expressed in CTL Time boundcd properties can be verified using RTCTL model checking Moreover, algorithms derived from symbolic model checking are used to compute quantitative information about the model The information produced allows the user to check the temporal correciness of the model: schedulability of the tasks of the system can be determined by computing their response time; reaction times to events and severa! other parameters of the system can also be analyzed by this method This information provides insight into the behavior of the system and in many cases it can help identify inefficiencies and suggest optimi-zations to the design The same algorithms can then be used to analyze the perfor-mance of the modified design The evaluation of how the optimizations affect the design can be done before the actual implementation, significantly reducing develop-ment costs Another advantage of our approach is that the Verus language has been especially designed to allow a straightforward description of the temporal characteris-tics of programs This makes modeling real-time Systems in Verus a simpler task Verus uses a discrete notion of time A Verus program is modelled by a finite state-transition graph where each transition corresponds to one time unit The sim-plicity of this representation makes it amenable to a symbolic implementation using BDDs The tool is very efficient, as attested by the Systems verified One example has 15 concurrent processes and counterexamples that have thousands of states have been produced in seconds Perhaps even more indicative of the usefulness of the method are the types of Systems verified We have applied this method to the verification of several real Systems, such as an aircraft controller , a robotics controller and a distributed heterogeneous real-time system АП examples verified are either actual Systems or use componente and protocols employed in current industrial products 1 This research was sponsored in part by the National Science Foundation under grant no CCR-9217549, by the Semiconductor Research Corporation under contract 95-DJ-294 and by the Defense Advanced Research Projects Agency, information Science and Technology Office, under title "Research on Paral-lel Computing", ARPA order no 7330, issued by DARPA CMO under Contract MDA972-90-C-0035 453 2 The Verus Language The main goal of the Verus language is to allow engineers and designers to describe real-time Systems easily and efficiently it is an imperative language with a syntax resembling that of C The data types allowed in Verus are fixed-width integer and boolean Nondeterminism is supported, which allows partial specifications to be described Language constructs have been kept simple in order to make the compila-tion into a state-transition graph as efficient as possible Smaller representations can then be generated, which is criticai for the verification and permits larger examples to be handled Details about the Verus language can be found in OverView A fragment of a simple real-time program is used to give an overview of the language This program implements a solution for the producer-consumer problem by bounding the time delays of its processes No synchronization is needed if the time delays of producer and consumer are defined properly The code for the producer is shown below Variable p is an index to the data buffer After initializing index p and variable produce, the producer enters a nonterminating loop in which items are produced at a certam rate Line 7 introduces a time delay of 3 units, after which an item will be produced Line 8 marks production by asserting produce in line 9 the index p is updated Line 10 ensures that the event produce is observed it is needed because the state of a Verus program can only be observed at wait statements 1 producer(p) 2 { 3 boolean produce; 4 P = 0; 5 produce = false; 6 while(lstop) { 7 wait(3); 8 produce = true; 9 P = P + 1; 10 wait(1); 11 produce = false; 12 }; 13 } Figure 1 Producer code in Verus time passes only on wait statements, lines 4, 5 and 6 execute in time zero This feature allows a more accurate control of time, and eliminates the possibility of implicit delays influencing verification results it also generates smaller models, since contiguous statements are collapsed into one transition The main function (not shown for brevity, as well as the consumer code) com-pletes the program by instantiating all processes Process instantiation in Verus fol-lows a synchronous model, all processes execute in lockstep Asynchronous behavior can be modeled by using stuttering, which introduces nondeterministic transitions This technique is described in 454 Other Features Veros has many other features not shown in this program For example, nondetermin-ism is implemented using the select statement To illustrate how select works, let’s assume that the producer is not required to actually produce an item after 3 time units, but may instead leave the value of p unchanged This can be modelled in Verus by changing line 9 to p = select{p, p+1); The timing characteristics of the system can be easily modeled using the periodic and deadline statements For example, the code below specifies that S1 must execute once every 100 time units Also, it must finish execution in less than 100 units, other-wise an exception will be raised: periodictO, 100, 100) { Si; }; The first parameter of periodic is the start time, which specifies how many time units the code will idle before starting its execution for the first time The second parameter is the period, that is, how often the code will execute The tliird parameter defines a deadline if execution does not finish before the deadline an exception will be raised Execution may take longer than the sum of the waits because of synchroni-zation The deadline statement is similar, but it does not specify a period Exception handling as well as the periodic and deadline statements are explained in 3 The Veriflcation Algorithms CTL and RTCTL Model Checking Verus allows the veriflcation of untimed properties expressed as CTL formulas as well as of timed properties expressed as RTCTL formulas RTCTL extends CTL by allowing bounds on all CTL operators to be specified Many important properties of real-time Systems can be verified using both CTL and RTCTL model checking For example, we have used RTCTL to show the existence of priority inversion in a real-time system in this example, we have modeled a simple real-time system in which processes communicate in a non-regular pattem The bounded until operator allows us to determine the existence of priority inversion, and to check that the solu-tion implemented, priority inheritance, avoids the problem Quantitative Algorithms Most veriflcation algorithms assume that timing constraints are given explicitly Typi-cally, the designer provides a constraint on response time and the verifier automati-cally determines if it is satisfled or not However, these techniques do not provide an у information about how much a system deviates from its expected pcrformancc, although this information can be very useful in fine-tuning the system behavior Verus implements algorithms that determine the minimum and maximum length of all paths leading from a set of starting states to a set of final States it also has algorithms that calculate the minimum and the maximum number of times a specified con-dition can hold on a path from a set of starting states to a set of final states Our algorithms provide insight into how well a system works, rather than just determining whether it works at all They enable a designer to determine the timing characteristics of a complex system given the timing parameters of its components This information is especially useful in the early phases of system design, when it can be used to estab-lish how changes in a parameter affect the global system behavior 455 Several types of infonnation can be produced by this method Response time to events is computed by making the set of starting states correspond to the event, and the set of final states coirespond to the response Schedulability analysis can be done by computing the response time of each process in the system, and comparing it to the process deadline Performance can be determined in a similar way Selective Quantitative Analysis and interval Model Checking The algorithms described above compute the minimum and maximum time delays along every possible execution sequence of a real-time system in many situations, however, we may be interested in computing time delays that reiate only to execution sequences that satisfy a given property We propose a method for specifying and veri-fying properties such as these The user specifies a property that must be satisfied in all paths traversed This property is expressed using linear-time temporal logic (LTL) Special model checking techniques are used to ensure that only paths satisfying the formula are considered by the algorithms 4 Conclusions This work describes Verus, a new tool to be used in the formal verification of real-time systems in Verus the designer specifies the system to be verified in a C-like language, and uses temporal logic model checking and quantitative timing analysis to verify its correciness The infonnation produced by our tool can help in verifying a real-time system in many ways it not only assists in detennining its correciness, but also provides insight into the behavior of the system This allows for a better under-standing of the system and in some cases it even suggests optimizations to the design We have used this tool to analyze several real-time systems of industrial complex-ity, such as an aircraft controller, a robotics controller and a distributed heterogeneous system in all cases we have been able to determine the temporal correciness of the system in several instances the results produced suggested modifications to the design that resulted in more efficient systems 5 References 1 S V Campos A quantitative approach to the formal verification of real-time systems Ph D thesis, SCS, Carnegie Mellon University, 1996 2 S V Campos The priority inversion problem and real-time symbolic model checking Technical Report CMU-CS-93-125, Carnegie Mellon University, 1993 3 S V Campos and O Grumberg Selective quantitative analysis and interval model checking: verifying different facets of a system Computer Aided Verification, 1996 4 S Campos, E Clarke, W Marrero, M Minea, and H Hiraishi Computing quantitative characteristics of finite-state real-time systems iEEE Real-Time Systems Symposium, 1994 5 S Campos, E Clarke, W Marrero and M Minea Verus: a tool for quantitative analysis of finite-state real-time systems Languages,Compilers and ToolsforReal-Time Systems, 1995 6 E Clarke, O Grumberg, and H Hamaguchi Another look at LTL model checking Com-puter-Aided Verification, LNCS voi 818 Springer-Verlag, 1994 7 E A Emerson, А К Мок, A P Sistla, and J Srinivasan Quantitative temporal reasoning Computer-Aided Verification, 1990 8 K L McMillan Symbolic model checking - an approach to the state explosion problem Ph D thesis, SCS, Carnegie Mellon University, 1992 Experience with Formal Verification of SDL Protocols Marius Minea*y Cornel izbasa*z Calin Jebelean*y marius@cs utt ro cizbasa@info uvt ro calin@cs utt ro * institute e-Austria Timisoara У Department of Computing, "Politehnica" University of Timisoara Z Department of Computer Science, West University of Timisoara Abstract This paper presents a case study in the application of formal methods to the verification of communication protocols We analyze one component block of tele-phone switching software developed in the SDL language at Alcatel Network Systems Romania We use the iF toolset from VERiMAG Grenoble to build a state-transition model of the system and verify selected properties We present the steps performed for translation and verification and discuss the potential for automating the process and using it on a larger scale 1 introduction Traditionally, the most commonly used methods for ensuring the correciness of a system have been simulation and testing While both have their strong points - simulation for evalu-ating functionality early in the design, and testing for ascertaining the behavior of the actual finished product - they clearly have significant limitations For one, neither simulation nor testing can be exhaustive for any reasonably complex system, leaving open the possibility of unexpected behavior in situations that have not been explored Moreover, testing takes up a large part of development costs, and errors discovered late in the development process can be prohibitively expensive Verification is critical especially for concurrent systems, which often present intricate interactions between components that are difficult to follow and evaluate without formal and automated support Errors can sometimes occur only for specific execution sequences which are difficult if not impossible to reproduce or debug, making an exhaustive analysis necessary Formal verification has matured in the past decade to a point where it provides an effective answer to the above problems Speaking most generally, it involves building a model of the system under scrutiny, and performing an exhaustive analysis, both model construction and verification being done with rigorous formal techniques Formal verification is exhaustive, covering all possible system behaviors; it is also highly automatable Most major companies in the computer and telecommunication industries have formal verification groups that apply these methods in the design process, and perform in-house re-search Moreover, for certam critical systems, the application of formal methods has become *This researchwas partly sponsoredby the Ministries of Education, Science, and Culture (BMBWK), and of Economy and Work (BMWA) of Austria under grants GZ 45 527 1-Vi B 7a 2002 and GZ 98 244 1-i 18 02 2 Marius Minea, Cornel izbasa, Calin Jebelean a requirement, both for structuring the development process and for verifying the resulting product For a survey on the state of the art in the field, including numerous industrial exam-ples, see 2 The Verification Problem 2 1 The SDL Language The Specification and Description Language SDL is supported and standardized by the international Telecommunications Union (iTU-T) it provides both concurrent and real-time aspects and is particularly suited for the description of communication protocols Systems are decomposed into blocks and processes, the latter being the unit of concurrency Code is further modularized into procedures Processes interact asynchronously via signals that are placed into and consumed from queues The communication structure is given by signalroutes that connect individual system components SDL has a formal semantics and has thus naturally generated interest in formal verifica-tion it is amenable to automatic verification techniques like model checking, by translating the SDL description into an automaton-based representation, which is then exhaustively ana-lyzed by state-space exploration algorithms 2 2 The Case Study The code base for the systems developed in SDL at Alcatel is extremely large, both in terms of the number of files and lines of code The SDL descriptions are complemented by low-level routines written in C Coding activity involves mostly maintenance and development of new features and integration with the existing system There is a fairly high amount of unit and non-regression testing Specifications are natural language descriptions for the individual behavior of the smallest-grained design units, as well as message sequence charts describing the desired scenarios of message propagation through the system To assess feasibility of applying formal verification in this setting, we started out with analyzing a small component part that would be amenable to full state space exploration and also comprehensible for an outsider The chosen block serves as an intermediate communication step in the establishment of a telephone connection, in which certain special services are requested from a server Several types of functionality are possible, and the block is in charge of performing the appropriate type of dialog depending on the parameters of the initiating and subsequent messages The block has two interfaces, one upstream to the caller and one downstream to the server, comprising a total of some two dozen signals Functionality is implemented in a single pro-cess, and 8 procedures, which comprise 1500 lines of SDL code (excluding comments) Most specifications are expressed in terms of unit tests to be performed and involve check-ing the correct establishment of the dialogue depending on the various message parameters There are also some more complex aspects which warrant verification Messages can carry parameters which are memory references to allocated buffers, and the specification states that these have to be freed properly according to certain rules Also, a significant part of the protocol logic is dedicated to checking that both upstream and downstream interfaces are shut down properly when the connection is terminated, which can occur due to a variety of causes Experience with Formal Verification of SDL Protocols 3 2 3 Related Work Research on verification of SDL designs has been done both in academic and industrial set-tings At Siemens, the verification of a layer of the GSM protocol is described in The in-house BDD-based model checker SVE is used to verify designs of up to 6 processes and 1013 reachable states The developers of the iF toolset used in this paper have performed several case studies , including a standardized protocol (SSCOP) developed by France Telecom, with 2000 lines of SDL code, and the control layer of the MASCARA ATM protocol with 3000 lines of SDL code The latter study especially contains a good quantitative comparison of the reduction benefits obtained by various methods, including live variable analysis, partial order reduction, and compositional reasoning The MASCARA protocol was also analyzed using the Spin model checker using a translation from iF as a starting point 3 The Verification Flow Our goal was to use existing verification tools as much as possible, identify pluses as well as limits and draw conclusions about the most needed developments that would allow large-scale applicability to industrial-size systems While there has been some considerable interest for the verification of SDL designs, there are few freely available systems that deal with SDL code directly Some verification tools based on Petri nets have been built with the intention of accommodating SDL as an input language, but currently SDL support is either restricted to a nonstandard subset (PEPtool from the University of Oldenburg) or not yet complete (the Maria tool from Helsinki University of Technology) We have selected the iF toolset from the VERiMAG research laboratory in Greno-ble iF is an intermediate representation and validation environment for timed asynchronous systems it consists of a textual language which is suitably expressive for the description of a large class of such systems, translators that interface with commonly used description languages such as LOTOS and SDL, and a toolset that supports state space exploration, sim-ulation and validation Code Translation As a first step, the SDL description was translated into iF We used the sdl2if translator, which is part of the iF toolset, and relies on the SDL APi provided by the Telelogic ObjectGEODE SDL compiler to access the intermediate representation built during parsing Since iF was designed largely with the translation of SDL in mind, the result is struc-turally very similar to the original SDL description, but reduced to a set of primitive language features suitable for analysis Thus, working with the iF translation should be easily doable for a designer familiar with SDL if the process were to be used in a larger setting One limitation of the current version of the sdl2if translator is that procedures are han-dled through inline expansion This resulted in a code blowup from 1500 non-comment lines of original SDL code into 26 000 lines of iF representation While the resulting iF code was still analyzable without exceeding reasonable performance limits, it resulted in a high overhead in generating, parsing and compiling the model Moreover, the resulting code was difficult to follow visually, something which was important at this experimentation stage, especially since the verification team was not familiar in detail with the code functionality 4 Marius Minea, Cornel izbasa, Calin Jebelean Consequently, we separated the translation of each procedure Since the procedure call graph for this example is acyclic, only one instance of each procedure can be active at any given time Thus, it suffices to introduce a "return address" variable of enumeration type for each procedure, which identifies the call location in the program text, and is tested upon exit from the procedure to determine the proper next state Procedures which were called only once were left in their inlined expansion This straightforward change reduced the generated iF code to 2000 lines Other code processing Further treatment was necessary due to the semi-formal modeling style adopted, which mixes SDL with code fragments written in C SDL allows both decisions (conditionals) and tasks (such as assignments) to be specified as arbitrary text strings, which are uninterpreted The outcome of a decision in such a case is specified as being unknown in our case, con-forming to a fairly typical modeling style, the descriptive strings are followed by comments which contain the actual C code for the decisions and tasks respectively This code is han-dled appropriately by the Telelogic ObjectGEODE suite when compiling SDL into C Using scripts, we embedded the C actions into the generated iF output and translated them into iF syntax Another related issue was the preprocessing occurring upon message send and receive The SDL portion of the code contained signals with no parameters in reality, messages sent and received have a large number of fields These are handled by preprocessing routines writ-ten in C that copy the relevant message fields to and from appropriate variables in the context of the process For the purpose of this study, the appropriate signal parameters and code stubs on send or receive were inserted into the iF code by hand For large-scale applicability, automation of this procedure is feasible considering that the corresponding code is clearly structured and marked for treatment by the SDL compiler Abstraction At this step, performing an abstraction on the resulting design becomes necessary As already mentioned, the messages sent and received by the block under consideration have a rather large number of fields Some do not directly influence the behavior of this block, but are either forwarded from an interface to another, or are set by the block for use by the communicating blocks upstream or downstream Their relevance to the property under verification can e determined automatically by a dependence analysis (live variable analysis or program slicing) The iF toolset incorporates a source-to-source translator if2if that performs such simplifications on the design For the purpose of the studied example, since message fields and their treatment had to be inserted by hand from the C description, only the fields actually used in the SDL portion of the code were inserted in the first place in addition, the data width of some variables was reduced in order to cut down on the state space of the system The protocol relies on memory references to buffers being transmitted in certain message fields From the point of view of the block under consideration, references are an abstract data type for which the only operations are copying and testing for a null value Thus it is formally justifiable to reduce the width of reference variables to one bit After this processing, the resulting model has 50 control states (out of which 13 are stable and the remainder are introduced in the translation to model decisions and procedure returns), and 25 bits of data, which accounts for a potential state space of about 400 million states Experience with Formal Verification of SDL Protocols 5 Verification interface The if open compiler translates the iF description into a C source file which contains data structures and functions for representing and exploring the corresponding transition system This C description can be linked with the toolset's libraries to produce one of several standalone executables for analyzing the system behavior One such program is a simulator which provides a text interface presenting at each point the possible transitions that can be taken by the system, one for each message (with various values for the parameters) produced by the environment it is also possible to produce a state space generator which writes out a textual description of the model as a labeled transition system for subsequent use by other tools, and an evaluator for specifications written in alternation-free ^-calculus interfaces with other verification tools Through the labeled transition system produced by the generator, the toolkit can interface with the CADP (Caesar-Aldebaran) verification toolset developed at iNRiA This allows several processing steps to be done on the automaton description of the system, as well as the use of alternative verification algorithms An useful such step is the renaming of tran-sition labels in the model description, for instance in order to collapse transitions with the same message but different parameters Another option is the hiding of transitions, which is useful when the specification refers only to several relevant transition, the rest being ignored CADP supports minimization of automata after performing such transformations as well as bisimilarity checking among two automata, and ^-calculus formula evaluation Using another translator, if2pml , developed at Eindhoven University of Technology, iF can interface with one of the most widely used model checkers, Spin , written at Bell Laboratories Spin is also targeted specifically towards communication protocols, with an input language (Promela) resembling both C and Communicating Sequential Processes in addition to verifying specifications written in linear temporal logic (LTL), Spin incorporates an interactive simulator which can represent a system run using Message Sequence Charts This is particularly useful, since the functionality of the block under analysis is also described using MSCs, a common formalism for the specification of communication protocols Most of the verification results we present have been obtained with the iF toolset directly We are presently evaluating both CADP and Spin as alternatives to complete the study 4 Verification Results Lightweight verification As might be expected, we have found both the simulator facility in the iF toolset as well as the simulator in Spin useful for validating the functionality of the protocol and our under-standing of it, and for presenting our results to the designers While not being an aspect of formal verification proper, such complementary support is crucial for developing confidence in the verification results The simplest kinds of specifications for the model under analysis are those used for unit testing Most of the time, they specify that the reception of a particular message is followed by the emission of another message, perhaps with some correspondence between their pa-rameters Still most of the time, emission is an immediate consequence of the reception For these cases, one particular feature of the iF toolset has proved very useful The generator which produces the textual description of the state-transition system labels a transition with the message received or sent on that transition, or with "i" for an internal transition As 6 Marius Minea, Cornel izbasa, Calin Jebelean an option, the generator can also produce the unstable states introduced in the translation to handle decision points, or just the stable states The latter option results in transitions that correspond to one reactive step of receiving a message, performing some computation and sending the response in this case, the transition label is a concatenation of messages received and sent, together with their parameters A sample label may read: -(proc,queue,mrecv,{{0,0,0}}) +(proc,queue,msent,{{0,0,0}}) i i For unit tests where the output is emitted in the same transition upon receiving the in-put, this provides a very simple check We generated the labeled state-transition system and extracted all transition labels (about 300) For all input response unit tests we then checked whether the list contained precisely the expected message matches With this test, we found a potential problem in the release of buffer references sent as message parameters The specification states that for any message whose references are not retransmitted on the other interface, the references have to be freed (by emitting appropriate messages for this task) We identified that for one particular closure message, the references were not freed in some states and reported the issue to the designers Detailed analysis of the scenario revealed this not to be an error, since no valid references are expected in that case Checking g-calculus formulae The evaluator built by the iF toolset can check temporal formulas written in an alternation-free fragment of the g-calculus This provides an expressive means of specifying a wide variety of properties in brief, formulas are evaluated as sets of states; a specification is true if it is satisfied by the initial state if f denotes a formula, and a denotes an action, the temporal modalities are: • [a]f = {p  8q p ! q ) q = f g (the states for which all a-successors satisfy f) • f = {p | 9q p ! q Л q = f g (the states with an a-successor that satisfies f) it is possible to use sets of actions, separated by | denoting "or", their complement, denoted by ! or the set of all actions, denoted * Using the least and greatest fixpoints as primitives, the following useful modalities can be defined: • all f = gfp X (f and [*]X) • pot f = lfp X (f or X) • inev f = lfp X (f or [*]X and T) A first and natural property to verify is absence of deadlock This is specified by all T (meaning that in every state some transition is possible) We continued by analyzing several properties for which unit tests are specified Their general structure is the following: assuming that a certain sequence of messages - perhaps with some given parameters - occurs, this sequence will be followed by one specified message For instance, if an opening message is answered by a connection establishment and then by an end of selection from downstream, the block will respond with an end of selection on the upstream interface Taking into account that the system has one "silent" transition before waiting for the initial message, this can be written: [*] pot pot inev[" +endsel out"]T This property and a few similar ones are verified practically instantaneously A further property states that in a certain state, a signal signifying progress of the call has to be accepted without influence on subsequent behavior For this, we verified a necessary condition: that the set of states in which the progress signal can be accepted once is the same as the set of states in which the progress signal can be accepted twice all ( T T) Experience with Formal Verification of SDL Protocols 7 if a message containing an invalid reference is sent, the block will be informed of this error by a message that requests closing down the current dialogue A requirement specifically stated in the specification is that this message has to be accepted at all times To specify this property, we need to identify and express the set of stable states, where the block can accept messages, as opposed to the intermediate transient states where other decisions are taking place To this effect, we first renamed all message outputs to internal transitions The desired stable states are then those for which some other transition other than internal transitions or passage of time are possible, and the property is stated: [" i"]all(not["! i| tick(-1)"]F => T) Finally, a property which was deemed particularly interesting by the protocol designers is that each of the two protocol interfaces shuts down properly The protocol logic implements this by sending a closure request and waiting for a confirmation; in case of a timeout, clo-sure is forced by sending that confirmation directly This dialogue is not needed if the block receives an abort message with a parameter specifying that the interface is already closed This means verifying that the stop state cannot be reached without one of these messages occurring, i e , the following is false: ifp X X or [" -tick(-1)"]F The system compiled from the iF description after performing the handling of procedures described in the previous section is reduced from 875 000 states (for inline expansion of pro-cedures) to 140 000 states This can be further reduced to 30 000 stable states if the transient states are collapsed when generating the labeled transition system individual time and memory consumption for the above properties, on a Pentium iii ma-chine at 750MHz is given in the following table: Property Time (s) Memory (MB) no deadlock 50 27 progress 67 36 abort 53 36 closure 16 19 5 Conclusions and Future Work As a first positive outcome, we have achieved our goal of showing that formal modeling and verification is applicable and useful for the system that we set out to analyze While the result is not push-button verification, and a significant one-time effort was involved in performing the study, many of the processing tasks that we performed manually are straightforwardly automatable, and a repeat effort will be significantly faster to carry out With respect to the properties analyzed, those corresponding to unit tests are verified almost instantaneously Also, their specifications, sequential in nature, are far simpler to write than temporal formulas in their full generality and - perhaps with the aid of pattern libraries - should be easily accessible to designers We were favorably surprised by the amount of information that can be extracted just from the labels of the transition system and consider this "lightweight" analysis to be valuable as an initial check The full value of an exhaustive formal analysis becomes apparent for more complex global properties While we identified and verified several such properties (e g , reference treatment and proper closure) even in the case of this single block, such properties will occur more often when verifying larger subsystems 8 Marius Minea, Cornel izbasa, Calin Jebelean in terms of code size, our study is comparable to state-of-the-art studies performed so far, though probably less complex in structure The resources used are still far from the limits of the currently available computing platform, which should allow scalability to multiple components larger in size One aspect of future work concerns automation, especially related to the identified mod-eling style, with action descriptions and external routines written in C code A second, more fundamental aspect concerns scalability A promising approach is by hiding of selected tran-sitions and subsequent minimization, as employed in the CADP toolset We will attempt to perform simplification already at the source level, to avoid generating complex systems in the first place We would also like to investigate compositional reasoning, by defining interfaces for each component, at appropriate levels of abstraction All of these should bring us closer to the goal of handling end-to-end properties of large systems Acknowledgments We are grateful to Marius Bozga of VERiMAG for his time and patience in providing support for the sdl2if translator and answering numerous questions about the iF toolset At Alcatel, our special thanks go to Florin Bunescu who as leader of one of the design groups provided constant help for everything we needed to know and do to carry out the study, and to Delia Golcea who as software development manager supported this project with great interest from the very beginning We also wish to thank Telelogic AB for providing a trial license of their SDL APi interface References Dragan Bosnacki, Dennis Dams, Leszek Holenderski, and Natalia Sidorova Model checking SDL with Spin in Tools and Algorithms for the Construction and Analysis of Systems 6th international Conference, TACAS 2000, Lecture Notes in Computer Science, 1785, 363-377 Springer Verlag, 2000 Marius Bozga, Jean-Claude Fernandez, Lucian Ghirvu, Susanne Graf, Jean-Pierre Krimm, and Laurent Mounier iF: A Validation Environment for Timed Asynchronous Systems in Computer Aided Verification 12th international Conference, CAV 2000, Lecture Notes in Computer Science, 1855, 543-547 Springer Verlag, 2000 Marius Bozga, Susanne Graf, and Laurent Mounier Automated validation of distributed software using the iF environment in Workshop on Software Model Checking, Electronic Notes in Theoretical Computer Science, 55(3) Elsevier, 2001 E M Clarke and J M Wing Formal methods State of the art and future directions ACM Computing Surveys, 28(4):626-643, 1996 J C Fernandez, H Garavel, A Kerbrat, L Mounier, R Mateescu, and M Sighireanu CADP: a protocol validation and verification toolbox in Computer Aided Verification 8th international Conference, CAV’96, Lecture Notes in Computer Science, 1102, 437-440 Springer Verlag, 1996 Gerard J Holzmann The model checker Spin iEEE Transactions on Software Engineering, 23(5):279-295, 1997 Guoping Jia and Susanne Graf Verification experiments on the MASCARA protocol in Model Checking Software 8th international SPiN Workshop, Lecture Notes in Computer Science, 2057, 123-142 Springer Verlag, 2001 Franz Regensburger and Aenne Barnard Formal verification of SDL systems at the Siemens mobile phone department in Tools and Algorithms for the Construction and Analysis of Systems international Conference, TACAS'98, Lecture Notes in Computer Science, 1384, 439-455 Springer Verlag, 1998 Natalia Sidorova and Martin Steffen Verifying large SDL-specifications using model checking in SDL 2001: Meeting UML 10th international SDL Forum, Lecture Notes in Computer Science, 2078, 403-416 Springer Verlag, 2001 computing@tanet edu te ua www tanet edu te ua computing iSSN 1727-6209 international Scientific Journal of CompuUng EXPERiENCE WiTH FORMAL VERiFiCATiON OF SDL PROTOCOLS Marius Minea 1,2), Cornel izbasa,1,3) Calin Jebelean, 1,2) 1) institute e-Austria Timisoara*, Bd V Parvan 4, 300223 Timisoara, Romania 2) Department of Computing, "Politehnica" University of Timisoara 3) Department of Computer Science, West University of Timisoara   marius@cs utt ro, cizbasa@info uvt ro, calin@cs utt ro Abstract: This paper presents a case study in the application of formal methods to the verification of communication protocols We analyze one component block of telephone switching software developed in the SDL language at Alcatel Network Systems Romania We use the iF toolset from VERiMAG Grenoble to build a state-transition model of the system and verify selected properties We present the steps performed for translation and verification and discuss the potential for automating the process and using it on a larger scale Keywords: formal verification, model checking, communication protocols, specification, SDL 1 iNTRODUCTiON Traditionally, the most commonly used methods for ensuring the correciness of a system have been simulation and testing While both have their strong points - simulation for evaluating functionality early in the design, and testing for ascertaining the behavior of the actual finished product - they clearly have significant limitations First, neither simulation nor testing can be exhaustive for any reasonably complex system, leaving open the possibility of unexpected behavior in situations that have not been explored Moreover, testing takes up a large part of development costs, and errors discovered late in the development process can be prohibitively expensive Verification is critical especially for concurrent systems, which often present intricate interactions between components that are difficult to follow and evaluate without formal and automated support Errors can sometimes occur only for specific execution sequences which are difficult if not impossible to reproduce or debug, making an exhaustive analysis necessary Formal verification has matured in the past decade to a point where it provides an effective answer to the above problems Speaking most generally, it involves building a model of the system under scrutiny, and performing an exhaustive analysis, both model construction and verification being done with rigorous formal techniques Formal verification is exhaustive, covering all possible system behaviors; it is also highly automatable Most major companies in the computer and telecommunication industries have formal verification groups that apply these methods in the design process, and perform in-house research Moreover, for certain critical systems, the application of formal methods has become a requirement, both for structuring the development process and for verifying the resulting product For a survey on the state of the art in the field, including numerous industrial examples, see 2 THE VERiFiCATiON PROBLEM The SDL language The Specification and Description Language SDL is supported and standardized by the international Telecommunications Union (iTU-T) it provides both concurrent and real-time aspects and is targeted for the description of communication protocols Systems are decomposed into blocks and processes, the latter being the unit of concurrency Code is further modularized into procedures Processes interact asynchronously via signals that are placed into and consumed from queues The communication structure is given by signalroutes that connect individual system components * This research was partly sponsored by the Austrian Ministries of Education, Science, and Culture (BMBWK), and of Economy and Work (BMWA) under grants GZ 45 527 1-Vi B 7a 2002 and GZ 98 244 1-i 18 02 SDL has a formal semantics and is thus naturally suited to formal verification Automatic verification techniques like model checking can be applied by translating the SDL description into an automaton-based representation, which is then exhaustively analyzed by state-space exploration algorithms The case study The code base for the systems developed in SDL at Alcatel is extremely large, both in terms of the number of files and lines of code The SDL descriptions are complemented by low-level routines written in C Coding activity involves mostly maintenance and development of new features and integration with the existing system There is a fairly high amount of unit and non-regression testing Specifications are natural language descriptions for the individual behavior of the smallest-grained design units, as well as message sequence charts describing the desired scenarios of message propagation through the system To assess the feasibility of applying formal verification in this setting, we started out with analyzing a small component part that would be amenable to full state space exploration and also comprehensible for an outsider The chosen block serves as an intermediate communication step in the establishment of a telephone connection, in which certain special services are requested from a server Several types of functionality are possible, and the block is in charge of performing the appropriate type of dialog depending on the parameters of the initiating and subsequent messages The block has two interfaces, one upstream to the caller and one downstream to the server, totaling some two dozen signals Functionality is structured in a single process and 8 procedures, comprising 1500 lines of SDL code (excluding comments) Most specifications are expressed in terms of unit tests to be performed and involve checking the correct establishment of the dialogue depending on various message parameters There are also more complex aspects which warrant verification Messages can carry parameters which are memory references to allocated buffers, which have to be freed properly according to certain rules in the specification Also, a significant part of the protocol logic is dedicated to checking that both upstream and downstream interfaces are shut down properly when the connection is terminated, which can occur due to a variety of causes Related work Research on verification of SDL designs has been done both in academic and industrial settings At Siemens, the verification of a layer of the GSM protocol is described in The in-house BDD- based model checker SVE is used to verify designs of up to 6 processes and reachable states The developers of the iF toolset used in this paper have performed several case studies , including a standardized protocol (SSCOP) developed by France Telecom, with 2000 lines of SDL code, and the control layer of the MASCARA ATM protocol with 3000 lines of SDL code The latter study especially contains a good quantitative comparison of the reduction benefits obtained by various methods, including live variable analysis, partial order reduction, and compositional reasoning The MASCARA protocol was also analyzed using the Spin model checker using a translation from iF as a starting point 3 VERiFiCATiON FLOW Our goal was to use existing verification tools as much as possible, identify pluses as well as limits and draw conclusions about the most needed developments that would allow large-scale applicability to industrial-size systems While there has been some considerable interest for the verification of SDL designs, there are few freely available systems that deal with SDL code directly Some verification tools based on Petri nets have been built with the intention of accommodating SDL as an input language, but currently SDL support is either restricted to a nonstandard subset (PEPtool from the University of Oldenburg) or not yet complete (the Maria tool from Helsinki University of Technology) We have selected the iF toolset from the VERiMAG research laboratory in Grenoble iF is an intermediate representation and validation environment for timed asynchronous systems it consists of a textual language which is suitably expressive for the description of a large class of such systems, translators that interface with commonly used description languages such as LOTOS and SDL, and a toolset that supports state space exploration, simulation and validation Code translation As a first step, the SDL description was translated into iF We used the sdl2if translator, which is part of the iF toolset, and relies on the SDL APi provided by the Telelogic ObjectGEODE SDL compiler to access the intermediate representation built during parsing Since iF was designed largely with the translation of SDL in mind, the result is structurally very similar to the original SDL description, but reduced to a set of primitive language features suitable for analysis Thus, working with the iF translation should be easy for a designer familiar with SDL if the process were to be used in a larger setting One limitation of the current version of the sdl2if translator is that procedures are handled through inline expansion This resulted in a code blowup from 1500 lines of original SDL code to 26000 lines of iF representation While the resulting iF code was still analyzable within reasonable performance limits, it resulted in a high overhead in generating, parsing and compiling the model Moreover, the resulting code was difficult to follow visually, something which was important at this experimentation stage, especially since the verification team was not familiar in detail with the code functionality Consequently, we separated the translation of each procedure Since the procedure call graph for this example is acyclic, only one instance of each procedure can be active at any moment Thus, it suffices to introduce a "return address" variable of enumeration type for each procedure, which identifies the call location in the program text, and is tested upon exit from the procedure to determine the proper next state Procedures which were called only once were left in their inlined expansion This straightforward change reduced the generated iF code to 2000 lines Other code processing Further treatment was necessary due to the semi-formal modeling style adopted, which mixes SDL with code fragments written in C SDL allows both decisions (conditionals) and tasks (such as assignments) to be specified as arbitrary text strings, which are uninterpreted The outcome of a decision in such a case is specified as being unknown in our case, conforming to a fairly typical modeling style, the descriptive strings are followed by comments which contain the actual C code for the decisions and tasks respectively This code is handled appropriately by the Telelogic ObjectGEODE suite when compiling SDL into C Using scripts, we embedded the C actions into the generated iF output and translated them into iF syntax Another related issue was the preprocessing which is performed on message sends and receives The SDL portion of the code contained signals with no parameters in reality, messages sent and received have a large number of fields These are handled by preprocessing routines written in C that copy the relevant message fields to and from appropriate variables in the context of the process For the purpose of this study, the appropriate signal parameters and code stubs on send or receive were inserted into the iF code by hand For large-scale applicability, automation of this procedure is feasible considering that the corresponding code is clearly structured and marked for treatment by the SDL compiler Abstraction At this step, performing an abstraction on the resulting design becomes necessary As already mentioned, the messages sent and received by the block under consideration have a rather large number of fields Some do not directly influence the behavior of this block, but are either forwarded from an interface to another, or are set by the block for use by the communicating blocks upstream or downstream Their relevance to the property under verification can be determined automatically by a dependence analysis (live variable analysis or program slicing) The iF toolset incorporates a source-to-source translator if2if that performs such simplifications on the design For the studied example, since message fields and their treatment had to be inserted by hand from the C description, only the fields actually used in the SDL portion of the code were inserted in the first place in addition, the data width of some variables was reduced in order to cut down on the state space of the system The protocol relies on memory references to buffers being transmitted in certain message fields From the point of view of the block under consideration, references are an abstract data type for which the only operations are copying and testing for a null value Thus it is formally justifiable to reduce the width of reference variables to one bit After this processing, the resulting model has 50 control states (out of which 13 are stable and the remainder are introduced in the translation to model decisions and procedure returns), and 25 bits of data, which accounts for a potential state space of about 400 million states Verification interface The if open compiler translates the iF description into a C source file which contains data structures and functions for representing and exploring the corresponding transition system This C description can be linked with the toolset's libraries to produce one of several standalone executables for analyzing the system behavior One such program is a simulator which provides a text interface presenting at each point the possible transitions that can be taken by the system, one for each message (with various values for the parameters) produced by the environment it is also possible to produce a state space generator which writes out a textual description of the model as a labeled transition system for subsequent use by other tools, and an evaluator for specifications written in alternation-free p-calculus interfaces with other verification tools Through the labeled transition system produced by the generator, the toolkit can interface with the CADP (Caesar-Aldebaran) verification toolset developed at iNRiA This allows several processing steps to be done on the automaton description of the system, as well as the use of alternative verification algorithms An useful such step is the renaming of transition labels in the model description, for instance in order to collapse transitions with the same message but different parameters Another option is the hiding of transitions, which is useful when the specification refers only to several relevant transition, the rest being ignored CADP supports minimization of automata after performing such transformations as well as bisimilarity checking of two automata, and p -calculus formula evaluation Using another translator, if2pml , developed at Eindhoven University of Technology, iF can interface with one of the most widely used model checkers, Spin , written at Bell Laboratories Spin is also targeted specifically towards communication protocols, with an input language (Promela) resembling both C and Communicating Sequential Processes in addition to verifying specifications written in linear temporal logic (LTL), Spin incorporates an interactive simulator which can represent a system run using Message Sequence Charts This is particularly useful, since the functionality of the block under analysis is also described using MSCs, a common formalism for the specification of communication protocols Most of the verification results we present have been obtained with the iF toolset directly We are presently evaluating both CADP and Spin as alternatives to complete the study 4 VERiFiCATiON RESULTS Lightweight Verification As might be expected, we have found both the simulator facility in the iF toolset as well as the simulator in Spin useful for validating the functionality of the protocol and our understanding of it, and for presenting our results to the designers While not being an aspect of formal verification proper, such complementary support is crucial for developing confidence in the verification results The simplest kinds of specifications for the model under analysis are those used for unit testing Most of the time, they specify that the reception of a particular message is followed by the emission of another message, perhaps with some correspondence between their parameters Moreover, emission is usually an immediate consequence of the reception For these cases, one particular feature of the iF toolset has proved very useful The generator which produces the textual description of the state-transition system labels a transition with the message received or sent on that transition, or with "i" for an internal transition Optionally, the generator can also produce the unstable states introduced in the translation to handle decision points, in addition to the stable states This option results in transitions that correspond to one reactive step of receiving a message, performing some computation and sending the response in this case, the transition label is a concatenation of messages received and sent, with their parameters A sample label might read: -(proc,q,mrcv,{{0,0}}) +(proc,q,msnd,{{0,0}}) i i For unit tests where the output is emitted in the same transition upon receiving the input, this provides a very simple check We generated the labeled state-transition system and extracted all transition labels (about 300) For all input response unit tests we then checked whether the list contained precisely the expected message matches With this test, we found a potential problem in the release of buffer references sent as message parameters The specification states that for any message whose references are not retransmitted on the other interface, the references have to be freed (by emitting appropriate messages for this task) We identified that for one particular closure message, the references were not freed in some states and reported the issue to the designers Detailed analysis of the scenario revealed this not to be an error, since no valid references are expected in that case Checking U-calculus formulae The evaluator built by the iF toolset can check temporal formulas written in an alternation-free fragment of the p-calculus This provides an expressive means of specifying a wide variety of properties in brief, formulas are evaluated as sets of states; a specification is true if it is satisfied by the initial state if f denotes a formula, and a denotes an action, the temporal modalities are: [a]f = { p | Vq pa > q => q |= f } (the states for which all a-successors satisfy f ) f = { p | 3q pa > q л q |= f } (the states with an a-successor that satisfies f) it is possible to use sets of actions, separated by denoting "or", their complement, denoted by ! or the set of all actions, denoted * Using the least and greatest fixpoints as primitives, the following useful modalities can be defined: all f = gfp X (f and [*]X) pot f = lfp X (f or X) inev f = lfp X (f or [*]X and T) A first and natural property to verify is absence of deadlock This is specified by all T (meaning that in every state some transition is possible) We continued by analyzing several properties for which unit tests are specified Their general structure is the following: assuming that a certain sequence of messages - perhaps with some given parameters - occurs, this sequence will be followed by one specified message For instance, if an opening message "open" is answered by a connection establishment "est" and then by an end of selection "isel" from downstream, the block will respond with an end of selection "osel" on the upstream interface Since the system has one "silent" transition before waiting for the initial message, this can be written: [*] pot pot inev["+osel"]T This property and a few similar ones are verified practically instantaneously A further property states that in a certain state, a signal signifying progress of the call has to be accepted without influence on subsequent behavior For this, we verified a necessary condition, that the set of states in which the progress signal can be accepted once is the same as the set of states in which the progress signal can be accepted twice: all ( T T) if a message containing an invalid reference is sent, the block will be informed of this error by a message that requests closing down the current dialogue A requirement specifically stated in the specification is that this message has to be accepted at all times To specify this property, we need to identify and express the set of stable states, where the block can accept messages, as opposed to the intermediate transient states where other decisions are taking place To this effect, we first renamed all message outputs to internal transitions The desired stable states are then those for which some other transition other than internal transitions or passage of time (tick) are possible, and the property is stated: [" i"]all(not["! i | tick(-1)"]F => T) Finally, a property which was deemed particularly interesting by the protocol designers is that each of the two protocol interfaces shuts down properly The protocol logic implements this by sending a closure request "cls" and waiting for a confirmation; in case of a timeout, closure is forced by sending the confirmation "cls" directly This dialogue is not needed if the block receives an abort message with a parameter specifying that the interface is already closed This means verifying that the stop state cannot be reached without one of these messages occurring, i e , the following is false: lfp X X or ["-tick(-1)"]F The system compiled from the iF description after performing the handling of procedures described in the previous section is reduced from 875000 states (for inline expansion of procedures) to 140000 states This can be further reduced to 30000 stable states if the transient states are collapsed when generating the labeled transition system individual time and memory consumption for the above properties, on a Pentium iii machine at 750MHz is given in the following table: Table 1 Verification performance Property Time (s) Memory (MB) no deadlock 50 27 progress 67 36 abort 53 36 closure 16 19 5 CONCLUSiONS AND FUTURE WORK As a first positive outcome, we have achieved our goal of showing that formal modeling and verification is applicable and useful for the system that we set out to analyze While the result is not push-button verification, and a significant one-time effort was involved in performing the study, many of the processing tasks that we performed manually are straightforwardly automatable, and a repeat effort will be significantly faster to carry out With respect to the properties analyzed, those corresponding to unit tests are verified almost instantaneously Also, their specifications, sequential in nature, are far simpler to write than temporal formulas in their full generality and perhaps with the aid of pattern libraries should be easily accessible to designers We were favorably surprised by the amount of information that can be extracted just from the labels of the transition system and consider this "lightweight" analysis to be valuable as an initial check The full value of an exhaustive formal analysis becomes apparent for more complex global properties While we identified and verified several such properties (e g , reference treatment and proper closure) even in the case of this single block, such properties will occur more often when verifying larger subsystems in terms of code size, our study is comparable to state-of-the-art studies performed so far, though probably less complex in structure The resources used are still far from the limits of the currently available computing platform, which should allow scalability to multiple components larger in size One aspect of future work concerns automation, especially related to the identified modeling style, with action descriptions and external routines written in C code A second, more fundamental aspect concerns scalability A promising approach is by hiding of selected transitions and subsequent minimization, as employed in the CADP toolset We will attempt to perform simplification already at the source level, to avoid generating complex systems in the first place We would also like to investigate compositional reasoning, by defining interfaces for each component, at appropriate levels of abstraction All of these should bring us closer to the goal of handling end-to-end properties of large systems Acknowledgments: We thank Marius Bozga of VERiMAG for his time and patience in providing support for the sdl2if translator and answering questions about the iF toolset At Alcatel, special thanks go to Florin Bunescu who as leader of one of the design groups provided constant help with everything we needed to carry out the study, and to Delia Golcea who as software development manager supported this project with great interest from the very beginning We also thank Telelogic AB for providing a trial license of their SDL APi interface 6 REFERENCES D Bosnacki, D Dams, L Holenderski, N Sidorova Model checking SDL with Spin Proceedings, 6th international Conference on Tools and Algorithms for the Construction and Analysis of Systems (TACAS 2000), Springer Verlag, LNCS 1785, pp 363-377 M Bozga, J -C Fernandez, L Ghirvu, S Graf, J -P Krimm, L Mounier iF: A validation environment for timed asynchronous systems Proceedings, 12th international Conference on Computer Aided Verification (CAV 2000), Springer Verlag, LNCS 1855, pp 543-547 M Bozga, S Graf, L Mounier Automated validation of distributed software using the iF environment Proceedings, Workshop on Software Model Checking, Elsevier Electronic Notes in Theoretical Computer Science 55(3) (2001) E M Clarke, J M Wing Formal methods State of the art and future directions ACM Computing Surveys, 28(4) (1996), pp 626-643 J -C Fernandez, H Garavel, A Kerbrat, L Mounier, R Mateescu, M Sighireanu CADP: a protocol validation and verification toolbox Proceedings, 8th international Conference on Computer Aided Verification (CAV96), Springer Verlag, LNCS 1102, pp 437-440 G J Holzmann The model checker Spin iEEE Transactions on Software Engineering, 23(5) (1997), pp 279-295 G Jia, S Graf Verification experiments on the MASCARA protocol Proceedings,8th international Workshop on Model Checking of Software (SPiN 2001), Springer Verlag, LNCS 2057, pp 123-142 F Regensburger, A Barnard Formal verification of SDL systems at the Siemens mobile phone department Proceedings, 4th international Conference on Tools and Algorithms for the Construction and Analysis of Systems (TACAS98), Springer Verlag, LNCS 1384, pp 439-455 N Sidorova, M Steffen Verifying large SDL-specifications using model checking Proceedings, Meeting UML: 10th international SDL Forum (SDL 2001), Springer Verlag, LNCS 2078, pp 403-416 Partial Order Reduction for Model Checking of Timed Automata ? Marius Minea Carnegie Mellon University, School of Computer Science Pittsburgh, PA 15213-3891 marius+@cs cmu edu Abstract The paper presents a partial order reduction method applica-ble to networks of timed automata The advantage of the method is that it reduces both the number of explored control states and the number of generated time zones The approach is based on a local-time seman-tics for networks of timed automata defined by Bengtsson et al , and used originally for local reachability analysis in this semantics, each component automaton executes asynchronously, in its own local time scale, which is tracked by an auxiliary reference clock On communication transitions, the automata synchronize their time scales We show how this model can be used to perform model checking for an exten-sion of linear temporal logic, which can express timing relations between events We also show how for a class of timed automata, the local-time model can be implemented using difference bound matrices without any space penalty, despite the need to represent local time Furthermore, we analyze the dependence relation between transitions in the new model and give practical conditions for selecting a reduced set of transitions 1 introduction Model checking has emerged as a very successful automatic verification tech-nique for finite-state systems However, its application is still limited by the state space explosion problem The number of possible states in a system grows ex-ponentially with the number of component parts, quickly exceeding the current capabilities of verification tools For timed systems, the complexity in the control space is increased by the timing information that needs to be maintained, since each untimed state can be reached at many different time instances Partial order reduction is a well-established method to reduce the complexity of state space exploration in asynchronous systems it explores a restricted number of interleavings for independent concurrent transitions, while preserving the verified property in the reduced model However, in timed systems the implicit synchronization among transitions, caused by the passage of time, makes the application of this technique problematic This paper shows how to perform partial order reduction for continuous-time systems modeled as timed ? This research was sponsored in part by the Semiconductor Research Corporation (SRC), the National Science Foundation (NSF), and the Defense Advanced Research Projects Agency (DARPA) Jos C M Baeten, Sjouke Mauw (Eds ): CONCUR’99, LNCS 1664, pp 431-446, 1999 © Springer-Verlag Berlin Heidelberg 1999 432 Marius Minea automata, while preserving properties specified in an extension of linear-time temporal logic augmented with explicit time constraints 2 Timed Automata 2 1 Deflnition Timed automata are transition systems extended with real-valued clocks which advance at the same rate and can be reset on executing a transition Both states and transitions are associated with temporal constraints on the clocks Deflnition 1 A clock is a variable over the set iR+ of nonnegative reals A clock valuation for a set of clocks C = {xi,      , xn} is a function v : C ! iR+ Deflnition 2 An atomic clock constraint is an inequality of the form x c, c g x, or x — y -X c, where x, y are clocks, c 2 ZZ is an integer and ^2 { ' iff a = ' does not hold • a = 'i Л '2 iff a = 'i and a = '2 • a = '1 U '2 iff 9k > 0 such that ak = '2 and aj = '1 for all 0 y) if b is executed before a, the system reaches first the state ((s1, s'2),x > y), and then the state ((s!, s'2),x y x 1; • rk = (d, i) 2 Ta, sk = sk-1, vk = vk-1 +i d and 8d' 2 i,(sk)(vk + d'), or • r, e 'T (sk-1 vk-1) tk ("k vk) d Pk-1 delay (T,) — Pk-1 dplay (T,) for • Tk t 1 , (" , v ) * (" , o ) ana 2 ,i=i delayi(ii) — 2 ^i=i delayj( [) jor all i, j 2 active(rk) The first case is a local delay transition (sk-1, vk-1) (sk, vk) in automaton A, in the second case, an action transition (sk-1, vk-1) ! (sk, vk) is executed, under the additional constraint that the elapsed time (the sum of delays) is identical for all automata in the active set (For a local action transition, this additional constraint is void) in both cases, the transition rk is said to be enabled after the execution of ak-1 Denote by enabled(a) and enabled*(a) the set of transitions and transition sequences, respectively, that can follow a finite trace a For a finite execution trace a = (s0 ,v0) (s1 ,v1) ! (s,v), define time,(a) = t0 + l=1 delay,(rl), where t0 2 iR+ is an arbitrary timepoint at which the execution of a starts Then, time, (a) (or time,, when a is implicit) denotes the timepoint reached in A, after executing a The local configuration of A, reached by a is the tuple cfg,(a) = (s,,v,, time,), where v, denotes the restriction of v to the clocks of A, The global configuration of A is the tuple cfg (a) = (cfg i (a), cfg 2 (a),    , cfg n (a)), also denoted cfg (a) = (s,v, time) with time = (time1, time2,      , timen) The set of configurations is SC = S x (iR+)n Note that the enabling of an action transition is defined in terms of the trace executed so far The following result shows that a configuration determines completely the subsequently enabled transitions The proof follows directly from the definitions of parallel composition and the local-time model Proposition 1 The following properties hold in the local-time model L(A) for finite execution traces a and a' and transition r 2 enabled(a); • if cfg,(a) = cfg,(a') for all i 2 active(r), then r 2 enabled(a') and cfg,(ar) = cfg, (a'r) for all i 2 active (r) • cfgj(ar) = cfgj(a) for all j 2 active(r), where ar denotes the trace obtained by extending a with the transition r Consequently, two finite execution traces leading to the same configuration have the same enabled transitions For a configuration 7 2 SC one can thus define enabled(7) = enabled(a), where a is an execution trace such that cfg(a) = 7 Likewise, the successor configuration of 7 by a transition r 2 enabled(a) is defined as the configuration reached when extending the trace a by transition r: succT (7) = cfg (ar) This is again independent of a and we write 7 ! succT (7) We now prove the desired independence properties for transitions in L(A) in general, two transitions are called independent if neither disables the execution of the other, and the same state is reached by executing them in either order: Partial Order Reduction for Model Checking of Timed Automata 437 Deflnition 9 Two transitions ті and T2 are independent iff for any finite execution trace a such that ті ,t2 2 enabled(a) the following two conditions hold: • Enabledness: t2 2 enabled(aT1) Л T1 2 enabled( M Theorem 4 Given an LTL^ formula for any execution trace in S(A) there exists an execution trace in F' (A) with the same truth value for ' and vice versa Proof The direct implication is straightforward: from a trace a in S(A) con-struct a trace ai in L(A) by replacing each global delay transition ; with the sequence of local delay transitions ; 1 ;n The trace al satishes O, since no action transitions are reordered, and F, since the same delay transitions are executed in each automaton Because delay transitions are invisible, this trans-formation preserves the truth value of ', and a = ' iff al = ' For the reverse implication, we construct a from al by reordering all transi-tions in increasing order of their timepoints The ordering condition O guarantees that no visible transitions are reordered, and the truth value of the formula is not changed Delay transitions may be split and reordered so every action transition is preceded by equal delays in all automata The fairness condition F guarantees that for all automata, local delay transitions with the needed amount exist in al Finally, all local delay transitions between two consecutive action transitions are merged into a global delay transition, resulting in a trace a of S(A) □ Based on the above theorem, we proceed as follows: We first define a restricted local-time model L'(A) whose traces satisfy the ordering condition O Next, we construct a zone automaton Z'(A) whose states are local-time atoms, i e , sets of configurations with the same truth value for all atomic subformulas of ' We show a correspondence between the traces of  '(A) and Z'(A), and then impose a fairness condition corresponding to F to ensure equivalence with the standard model Finally, we apply a maximization to the atoms in Z'(A) to obtain an automaton M'(A) which is finite and therefore amenable to model checking To preserve the ordering of visible transitions, we introduce a new reference variable tv, denoting the timepoint of the last visible transition executed The domain of the valuation v is extended to include tv in the initial configuration, v(tv) = 0 The model L'(A) is defined in the same way as L(A), but with the additional restriction v(tv) ) i ф — bi Л ДД=1 q'k, ф — false, q'k — qk от q'k — :qk} Define transitions between atoms as follows: z 1) z' if a 2 enabled(z) and z' 2 atoms'(succ) (z,a)), and z ) z if at least one local state of z has the invariant ii S) — true We obtain an atom graph for A and the formula ': Deflnition 13 (Atom graph) The atom graph A'(A) of a timed automaton A with respect to formula ' is a state-transition graph (Z', Z0, )), with Z0 the set of initial local-time zones, ) the atom transition relation and Z' the set of atoms reachable from Z0 by repeated application of ) Then, our problem reduces to LTL model checking: Proposition 5 For each execution trace nl of L'(A), there is an atom sequence in A' (A) that has the same truth value for 'q as nl has for ' and vice versa Proof The proof is based on reordering transitions as in Prop 2 (cf also ), with ) transitions corresponding to series of action-delay transitions in L'(A) in addition, ) transitions correspond to delay transitions in automata which remain indefinitely at a state with the invariant true Again, the ordering con-dition O ensures that the truth value of the formula is preserved □ We now restrict the zone execution sequences such that the execution traces included herein satisfy the fairness condition F Otherwise, the local-time model may contain traces that stop executing some automata and do not correspond to any trace in the standard model The fairness condition F is violated if the execution trace does not make infinite time progress in some automaton, i e , if the growth of a clock is always restricted by a state invariant This cannot happen if any clock which is infinitely often limited by an invariant is reset infinitely often, allowing time to diverge The fairness constraint can thus be written in terms of the structure of the automaton, ДxGC GFx bounded ) GFx reset The model checking problem on the initial network of automata is thus reduced to LTL model checking of a finite Kripke structure with a set of fairness constraints Partial Order Reduction for Model Checking of Timed Automata 443 A stronger fairness constraint restricts the atom graph A' (A) to zones that are synchronizable, i e , contain at least one synchronized configuration (with v(ti) = v(tj) for all i,j 2 1; n) This ensures that no more zones are explored in the local-time zone automaton than in the standard zone automaton, and the reduction is applied to a state space which is not larger than the original one This guarantee comes at the expense of an additional check for the enabledness of transition = in a given atom z, namely that succf (z, a) be synchronizable 3 7 Building a Finite Model The local-time zone automaton can be infinite, since difference bounds on clocks can become arbitrarily large in , a finite quotient is shown to exist, but no method to compare local-time zones for equivalence is given We show that, just as for the standard zone automaton, the actual value of time bounds does not affect the enabledness of transitions, once a certain value is exceeded Hence, each local-time zone can be normalized to obtain a finite model We adapt the maximization (rounding) operation described, e g , in to the local-time model Let cmax be the maximum absolute value of all constants in the automaton A and the formula ' Adapting the region graph construction of , two valuations v and v' are called region-equivalent (written v 'reg v') if for any time variables tu,tv 2 T+ , either | v(tu) — v(tv)J = | v'(tu) — v'(tv)J or both differences have the same sign and are greater in absolute value than cmax Region equivalence extends to configurations by defining (s, v) 'reg (s',v') iff s = s' and v 'reg v' Regions are the equivalence classes induced by 'reg on the set of configurations EC it is straightforward to show: Lemma 1 Let v 'reg v' Then: 1 if fi is any constraint in A or in the specification then v 2 fi iff v' 2 fi 2 For any clock set R, v[R ! 0] 'reg v'[R ! 0] 3 For i 2 1,n and d > 0 there exists d' > 0 such that v +i d 'reg v' +i d' Since Lemma 1 covers all operations involved in executing a transition, the following property follows (cf ): Proposition 6 Let y 'reg y' be two region-equivalent configurations in Ea 1 if y Y1, there exists y1 'reg Y1 such that y' y1   2 if y 71, there exists d' 2 iR+ and y' 'reg 71 such that y' "^і y'   The maximization of a zone z is the set of configurations which have some region-equivalent configuration in z: max(z) = {y' 2 EC | 2 z y 'reg y'} A maximized zone is therefore a convex union of regions it is easily seen that a maximized zone is obtained from the canonical representation of a zone by modifying all constraints involving constants Ec' with c' > cmax: tu — tv -Y —c' becomes tu — tv 3 Since tu —tx = tv —ty due to the previous synchronizations, the two conditions cannot be satisfied si-multaneously Exploring either of ) and ) restricts the current local-time zone to a fragment where the other transition is no longer enabled Partial Order Reduction for Model Checking of Timed Automata 445 Consequently, when selecting an ample set of transitions, one needs to check, just as for full state exploration, whether for every configuration in the current zone each of the explored automata is either be forced to execute an action transition or allows indefinite time progress Otherwise, a potential deadlock exists For a local transition, this check can be made statically by analyzing the invariant of the originating state together with the guard condition of the transition This gives us a practical condition for the selection of an ample set: Proposition 7 in a sync-reset network of automata, a local transition in a process with a single clock does not disable transitions in other automata, Proof Given local transition a in automaton Ai with a single clock x, the con-straints in the enabling condition of a can be of the form tx —ti -A c and ti—tx -A c in a sync-reset network of automata, the representation of a local-time constraint links ti only to clocks in the same automaton, i e , to tx Therefore, the conjunction ф1 Л 'фа does not induce stronger constraints on the other time variables and does not affect the enabledness of transitions in other automata □ Based on the above results, we can use the ample set approach to construct a reduced model for the automaton M'(A), and perform model checking by composing it with the tableau for the LTL formula 4 Conclusions and Future Work We have presented a method that allows the application of partial order re-duction to systems modeled as a composition of timed automata The method results in reduction in the state space, as well as in the number of clock zones that are generated for each control state Compared to previous related work, this paper shows that partial order reduction can be used for model checking of properties described in a timed extension of linear temporal logic, rather than just for local reachability analysis Furthermore, for a certain class of automata, we show that the local-time zones can be represented as efficiently as standard clock zones We also analyze the dependence relation between transitions in the new model and give practical conditions for selecting an ample set An implementation of the presented algorithm is in progress, and we expect it to support the theoretical claims for efficiency improvement with experimental results We also plan to extend the technique to models with other variants of synchronization, such as timed automata with deadlines Of particular interest is a detailed comparison of the present approach with techniques developed for other timed models, such as time Petri nets and timed event level structures, and possible improvements that can result from here Finally, we plan to explore how partial order reduction can be used for other finite quotient representations of timed automata, such as the region graph construction Acknowledgements The author wishes to thank his advisor, Ed Clarke, for careful reading and suggestions on improving earlier drafts of this paper 446 Marius Minea References 1 R Alur and D Dill Automata for modeling real-time systems in Automata, Languages, and Programming 17th int Colloquium Proc , LNCS v 443, pp 32235, Coventry, UK, July 1990 Springer 2 J Bengtsson, B Jonsson, J Lilius, and Wang Yi Partial order reductions for timed systems in CONCUR’98: Concurrency Theory 8th int Conf Proc , LNCS v 1466, pp 485-500, Nice, France, September 1998 Springer 3 W Belluomini and C J Myers Verification of timed systems using POSETs in Computer Aided Verification 10th int Conf , CAV’98 Proc , LNCS v 1427, pp 403-15, Vancouver, BC, Canada, June 1998 Springer 4 Computer Aided Verification 2nd int Conf , CAV’90 Proc , LNCS v 531, New Brunswick, NJ, USA, June 1990 Springer 5 E M Clarke and E A Emerson Design and synthesis of synchronization skeletons using branching time temporal logic Logic of Programs: Workshop, Yorktown Heights, NY, LNCS v 131, pp 52-71 Springer, May 1981 6 D Dams, R Gerth, B Knaack, and R Kuiper Partial-order reduction techniques for real-time model checking in Proc 3rd int Workshop on Formal Methods for industrial Criticai Systems, pp 157-69, Amsterdam, The Netherlands, May 1998 7 D L Dill Timing assumptions and verification of finite-state concurrent systems Proc int Workshop Automatic Verification Methods for Finite State Systems , LNCS v 407, pp 197-212, Grenoble, June 1989 Springer 8 P Godefroid Using partial orders to improve automatic verification methods in , pp 176-85 9 T A Henzinger, X Nicollin, J Sifakis, and S Yovine Symbolic model checking for real-time systems in Proc Seventh Ann iEEE Symp on Logic in Computer Science, pp 394-406, Santa Cruz, CA, USA, June 1992 iEEE Comp Soc Press 10 J Lilius Efficient state space search for time Petri nets in Proc MFCS’98 Workshop on Concurrency, Brno, Czech Republic, August 1998 Elsevier 11 K G Larsen, P Pettersson, and Wang Yi Compositional and symbolic model-cheking of real-time systems in Proc 16th iEEE Real-Time Systems Symp , pp 76-87, Pisa, italy, Dec 1995 iEEE Comp Soc Press 12 F Pagani Partial orders and verification of real-time systems in Formal Tech-niques in Real-Time and Fault-Tolerant Systems 4th int Symp Proc , LNCS v 1135, pp 327-46, Uppsala, September 1996 Springer 13 F Pagani Ordres partiels pour la verification de systemes temps reel (Partial orders for verification of real-time systems) PhD thesis, Centre d'Etudes et de Recherches de Toulouse, September 1997 14 D Peled All from one, one for all: on model checking using representatives in Computer Aided Verification 5th int Conf , CAV’93 Proc , LNCS v 697, pp 409-23, Elounda, Greece, June 1993 Springer 15 A Valmari A stubborn attack on state explosion in , pp 156-65 16 M Y Vardi and P Wolper An automata-theoretic approach to automatic program verification in Proc Symp on Logic in Computer Science, pp 332-44, Cambridge, MA, USA, June 1986 iEEE Comp Soc Press 17 H Wong-Toi Symbolic Approximations for Verifying Real-Time Systems PhD thesis, Stanford University, December 1994 18 T Yoneda and B -H Schlingloff Efficient verification of parallel real-time systems Formal Methods in System Design, 11(2):197-215, August 1997 DocuSign Envelope iD: 54CB2A2B-B521-47AO-9F80-06D32C4E8970 Bitdefender " Code: analysis, bugs, and security" CONTEST TERMS SHEET BiTDEFENDER SRL Responsabil de Contract Marius Tivadar Budget Owner Sorin Dudea > -DocuSigned by: Sdrivu Pu ui 5B553FABF8F143D Financial Approval Nicoleta Reitu 0—DocuSigned by: Nicoleta Reitu — F75C95A6CF714EF Legal Approval Mariana Dutu z DocuSigned by;  ѴідПЛІЛЛ рілбл * -9832524 BE45A4EC Date: January 18th, 2017 Page 0 DocuSign Envelope iD: 54CB2A2B-B521-47A0-9F80-06D32C4E8970 "Code: analysis, bugs, and security" CONDitii SPECiFiCE Concursul "Code: analysis, bugs, and security", denumit in continuare "Concursul", este oferit de B1TDEFENDER SRL, o societate cu sediul social in str Delea Veche nr 24, Cladirea de Birouri A, etaj 7, 024102 Bucharest, Romania, inregistrata ia Bucuresti, avand numar de inregistrare nr J40 20427 2005, reprezentata legal de Florin Talpes, in calitate de Director General denumita in continuare Bitdefender si se adreseaza studentilor Facultatii de AUTOMATiCa si CALCULATOARE din cadrul Universitatii POLiTEHNiCA din Timisoara A l PERiOADA CONCURSULUi Perioada de desfasurare a Concursului ("Perioada Concursului") este curpinsa intre 28 Septembrie 2016, ora 08:00 (GMT +2) si 13 ianuarie 2017, ora 16:00 (GMT +2) A 2 TERiTORiU: Timioara, Romania A 3 iNSCRiERE in vederea inscrierii in Concurs, participantii vor parcurge urmatoarele etape: inscrierea la cursul Code: analysis, bugs, and security organizat de Bitdefender in cadrul facultatii de AUTOMATiCa Si CALCULATOARE din cadrul Universitaii POLiTEHNiCA din Timioara, printr-un   de intentie Pagina web a Concursului: http:  staff cs upt ro  marius curs bitdefender index html A 4 MECANiSMUL CONCURSULUi Din studentii inscrisi la curs, 32 vor fi selectati pentru laborator Laboratorul reprezinta sesiuni practice, in care participanii isi pot dovedi competenele A 5 iNFORMAtii PRiViND PREMiiiLE Premile constau in 3 telefoane Google Pixel culoare neagra Valoarea totala a premiilor este de aproximativ 2000 EURO A 6 ALEGEREA CasTiGaTORULUi Din cei 32 de studenti selectati pentru laborator, vor fi alesi 3 studenti pe baza evaluarii activitatii la laborator si la curs Evaluarea activitatii la laborator si curs a studentilor selectati pentru laborator va fi efectuata de catre reprezentantii Bitdefender Decizia privind alegerea celor 3 castigatori ai prezentului Concurs va avea loc in data de 13 ianuarie 2017, ora 16:00 (GMT +2) Castigatorii vor fi notificati de Bitdefender prin adresa de   utilizata pentru a participa la Concurs si, de asemenea, vor fi prezantati in curpinsul paginii web a Concursului Prezentul Regulament de Concurs este guvernat de prevederile cuprinse in "Termeni si conditii generale", disponibil in mod gratuit oricarui solicitant (si sau participant) pe pagina web a Concursului http:  staff cs upt ro  marius curs bitdefender index html si ia sediul BiTDEFENDER in cazul in care Concursul inceteaza din cauza falsificarii sau a dificultatilor tehnice inainte de data de expirare, se va posta o notificare pe pagina web al Concursului BiTDEFENDER SRL FLORiN TALPES DiRECTOR GENERAL Bridging Dolev-Yao Adversaries and Control Systems with Time-Sensitive Channels Bogdan Groza and Marius Minea Politehnica University of Timisoara and institute e-Austria Timisoara * bogdan groza@aut upt ro, marius@cs upt ro Abstract Defining security objectives for industrial control scenarios is a chal-lenging task due to the subtle interactions between system components and be-cause security goals are often far from obvious Moreover, there is a persistent gap between formal models for channels and adversaries (usually, transition systems) and models for control systems (differential or recurrent equations) To bind these two realms, we translate control systems into transition systems by means of an abstraction with variable time granularity and compose them with a channel model that is controlled by Dolev-Yao adversaries This opens the road for automatic reasoning about the formal model of a control system using model checkers in a context where the communication channel is tampered with We address a se-curity objective that has so far largely eluded in models, namely freshness, which is highly relevant for control systems Beyond the traditional resilience to replay attacks, we point out several flavours of freshness which are often overlooked, e g , ordering and bounded lifespan We formalize these notions and show that their absence can lead to attacks that subvert the control system Finally, we build a proof-of-concept implementation that we use to determine attacks on a simple model which clearly shows that real-world scenarios are within reach Keywords: control system, formal modelling, freshness 1 introduction Context and Realism The generic image of a control system is that of a closed loop in which a controller regulates the behaviour of a process (usually called plant) as shown in Figure 1 The design of such systems is commonly based on intricacies known only to producers and insiders that use them However, an important aspect reconfirmed time and again by incidents such as stuxnet that is that the internal details of a system are hard to be kept secret to well motivated outsiders (likely, the worm exploited specific system details) Relying on security through obscurity is a fatal flaw Since for crypto-graphic protocols, modeling has proved to be a crucial tool to assess security, it is quite obvious that modeling industrial control systems in their relation to the communication channels and adversaries is much more relevant today as they become exposed as parts of internet-like structures, e g , internet of Things (ioT) indeed, there has been constant attention in the previous years on attack surfaces and countermeasures for control * This work is supported in part by FP7-iCT-2009-5 project 257876, SPaCioS: Secure Provision and Consumption in the internet of Services systems , but these lines of work are not based on Dolev-Yao adversary models While several related cases of modeling industrial communication channels exist, for example Modbus or Fieldbus , (the former using tools from the AViSPA project, a precursory of the tools that we employ here) we are unaware of any related work that tries to combine the behaviour of the control system with the communication channel and the adversary abilities Freshness The sparsity of work combining control systems and formal adversary models is compounded by the marginal interest toward certain objectives such as fresh-ness so far, freshness in security protocols has been interpreted mostly in the traditional sense that disallows the same message to be accepted twice by a principal, e g , preven-tion of replay attacks Clearly, cryptography provides tools to do more than this: nonces, counters and timestamps, carefully embedded in the protocol can all be used to assure ordering (establishing the order in which messages are issued) or limit lifespan (decide if a particular message is still valid) Syverson presents a taxonomy of replay attacks in which the classical sense is extended to more than the mere replay of a message The taxonomy considers not only classic replays, but also attacks in which a message (or part of it) is used in a context for which it was not intended, e g , interleaving, reflec-tion or deflection attacks indeed, this taxonomy evades the traditional interpretation of replay attacks as used by BAN logic However, in general, interleavings, reflections or deflections are treated as violations of non-injective agreement and they are not necessarily related to freshness Besides Syverson's taxonomy there is little inter-est to use freshness for more than uniqueness While all tools employed for automatic formal protocol verification are able to detect replay attacks, to the best of our knowl-edge there is no support to check for objectives such as ordering or limited lifespan Efforts to model time-sensitive security goals exist but appear to be rather isolated While in security protocols there seems to be a limited interest in freshness compared to other security objectives that have been extensively studied (e g , secrecy, authenticity, etc ), this objective can be critical in control scenarios Methodology and Results While disrupting standard security goals such as con-fidentiality or authenticity is within reach for the adversary modelled here, we are not specifically interested in such goals since there is consistent related work on how to model and assure them Even if a channel is secure in this sense, freshness is not necessarily guaranteed Here we address three flavours of freshness: uniqueness, which is the usual meaning, that a message cannot be subject to replay; ordering, if a principal does not accept messages out of order, and bounded lifespan, referring to the delay within which messages are accepted To model control systems, we translate the state model of a process into a transition system based on a Д-grain abstraction, resulting in a model that can interact with the adversary of the communication channel This formal model allows us to assess whether in the presence (or absence) of the previously mentioned freshness flavours an adversary can subvert the control law at will This opens the road to employ model checkers commonly used to verify security protocols in order to as-sess the security of a control system in this context Using a model checker, we analyze the composition of the adversary, the channel model, and the system model to obtain an attack trace Future work may include testing these attacks on real-world industrial communication channels, here we focus mostly on the theoretical foundations 2 System Model and Abstraction 2 1 State Space Model Bridging control engineering and computer science is a challenging task since the for-mer usually models systems by differential (continuous-time) or recurrent (discrete-time) equations while the latter uses finite state automata, transition systems, etc Still, there is significant interest to bridge the two The problem of extracting a transition system from a generic discrete (or continuous) time system was studied by Pappas Further refinements of the methodology can be found in later works by Girard and Pap-pas , where metrics are introduced to characterize the degree to which two systems are (bi)similar The same framework can be extended to non-linear systems, preoccu-pation for this can be found in the work of Tazaki and imura Definition 1 (Discrete Time System) A discrete-time system is a tuple ofthree spaces X, U, Y (domain of state, input and output), and twofunctions F, G (mapping the cur- rent state and input to the next state and output, respectively), i e , DTS(X, U, Y, F, G):   (()’()) where x(0) — т is some fixed initial state [y(l) — G(x(t);U(t)) This model is called the state space model since it accounts for the state of the system and is the preferred way to model control systems Example: a water tank system Consider amechanical-fluid system where a simple on off controller tries to preserve a given reference level (r) of fluid in the tank as shown in Figure 1 The controller receives the error e(t) computed as difference between the reference level and the output of the system y(t) (which is the height of fluid in the tank), then outputs the command u(t) A zero-order hold (ZOH) on the feedback loop preserves the value from the current time interval for the next, i e , the output of the plant at step t - 1 is the input of the controller at step t To model the tank we use the equations from which are straightforward from Bernoulli's equations The physical system parameters are: g gravitational acceleration (9 8 m s2), A1 tank area (m2), A2 orifice area (m2), h1 height of water in the tank (m), h2 height of orifice (m) and water inflow f1 — 0 004 (m3 s) The physical system behaviour is governed by Torricelli's law, that is: dh1(t) + A2y 2g(h1(t) — h2) — f1(t) This continuous time differential equation can be turned into a discrete time recurrent equation by re-placing the differential with a finite difference, e g , h1(t) — M(n+1)''')-Mn') where Ts is the discretization step By equating the finite difference with the differential the following discrete input-output model of the system is obtained : h1(n) — A |rsfi[n-1] + A1h1[n-1] - A2Tsp2g(h1(n) — h2)j The discrete input-output model is accurate enough for small values of Ts (in the order of seconds or hundreds of seconds) given that this mechanical-fluid system is not a fast process 2 2 A-grain Abstractions intuition Clearly, the recurrent equations that define a discrete system can be directly transposed into a transition system But the state space will likely be very large (even Controller Plant Fig 1 : Flow control system infinite in case when the state of the system is a real number, e g , the water level) and the complexity of this model will become prohibitive for our tools The intention behind the A-grain abstraction is to simplify the model of the system in terms of input, output and state spaces as well as transitions between states This is needed in order to make the model approachable by the formalism of the employed tools, and nevertheless usable (by selecting an abstraction which is just precise enough to check the desired property) The A-grain abstraction is flexible in the sense that it doesn't require describing the behaviour of the system at equidistant steps in time in the A-grain abstraction we are merely interested in the fact that the trajectory of the discrete system is eventually (after k steps) in relation with that of the abstraction Such an abstraction is not unique, for any real system there exist multiple A-grain abstractions Our minimal prescription for designing it, is to select the states of the process that trigger an output change from the controller as well as the states that are the target of the control rule or of the adversary, then to describe the transitions between them Choosing more abstract states leads to a more accurate model, but which is harder to verify, resulting in a trade-off Definition 2 (A-grain abstraction) A discrete time system DTS  (X, U, Y, F, G ) is a A-grain abstraction of a discrete time system DTS (X, U, Y, F, G) under relations Rx, Ru, Ry for states, inputs and outputs iff: i) for any x 2 X, y 2 Y, u 2 U there exist x  2 X  , y  2 Y  ,u  2 U  with (x,x ) 2 Rx, (y,y ) 2 Ry and (u, u ) 2 Ru, L i L i L L ii) for any x0 2 X, u0 2 U, x0 2 X , u0 2 U with (x0 , x0) 2 Rx, (u0, u0) 2 Ru there exists 0 1 then by condition iii) all intermediary states are part of the same abstraction which means (F(x, u), x ) 2 Rx Example of A-grain abstraction We build a A-grain abstraction for the previ-ous water tank model This model does not account explicitly for a state of the system and we apply the previous definition on its output, i e , the state plays the role of the output Assume the controller reference value r is set to 20 Naturally, one abstract state must be associated to the values above the reference and one to the values below it Let these states be med and med+ These states along with similar states for the adversary target, e g , high and high + , are enough in a minimalistic model But for better granularity, let us refine the state space of the abstraction (which represents the height of fluid and the output of the system) as X = Y  = {vlow vlow+ , low low + , med , med+, high , high + , vhigh , vhigh +g We set the input space of the abstraction as U  = {off, ong according to the valve close and open commands We define the relations between the abstract states and the real valued states as shown in Table 1 which summarizes the abstraction so far Let functions prec and succ return the value that precedes or succeeds another value in the set, e g , vlow + — prec(low ), high + — succ(high ), with the extremes as fixed points, vlow — prec(vlow ) and vhigh + — succ(vhigh+) At each step n we define the output of the plant according to Gp(off, y (n — 1)) = prec(y (n — 1)) and Gp(on, y (n — 1)) = succ(y (n — 1)) (this is in fact the value of y (n)) We use the same abstractions as in the case of the plant for the input and output spaces of the controller Similarly, we define the output of the controller as Gc(u (n — 1)) = off iff lower(u (n — 1), med ) or u (n — 1) = med and Gc (u (n — 1)) = on iff higher(u (n — 1), med ) Predicates lower and higher can be inferred from the already defined prec and succ We now show that these form a A-grained abstraction (the exact value of A is not relevant for this example as it is merely an upper bound) Relation i) of Definition 2 is clearly satisfied for both the plant and controller: for any state we have defined an abstract state Relations ii) and iii) are proved as follows For the plant, in any abstract state the next state will be the predeces-sor or successor of the current state according to the value of the abstract input: off or on in the case of the real plant, the input will be either 0 or 1 and given that this input is preserved constant eventually the water level will decrease or increase to a state that is related to the successor of the abstract state that is related to the current state Since whenever the input of the real plant is preserved constant, the output is a monotonic function, relation iii) is satisfied as well for the plant and until the next abstract state is reached all states are in relation to the current state For the controller, if the input (which is the water level) is preserved constant, there is no change in the output and the same happens in the real system which proves relation ii) Since the output does not change unless the input changes, relation iii) holds as well for the controller Table 1: Abstraction sets and relations with the real system Abstraction sets Relations between abstract and real values Uh = {off , ОП g X = Yh = {vlow   , ViOW +; low  , low +, med—, med+, high  , , vhigh  , vhigh+ g 8x 2 [O, 5) : (x, vlow ) 2 Rx, 8x 2 [5, 10) : (x, vlow +) 2 Rx Vx 2 [10, 15) : (x, low-) Vx 2 [20, 25) : (x, med-) Vx 2 [30, 35) : (x, high ) Vx 2 [40, 45) : (x, vhigh +) (0, off) 2 Rx, Vx 2 [15, 20) 2 Rx, Vx 2 [25,30) 2 Rx, Vx 2 [35,40) 2 Rx, Vx 2 [45, 50) 2 Ru (1, on) 2 Ru (x, low +) 2 Rx (x, med+) 2 Rx (x, high+) 2 Rx (x, vhigh+) 2 Rx The next proposition establishes that for any behaviour of the abstraction there exists a behaviour of the real system This property is important since otherwise an attack over the abstraction may simply be a false-positive alarm Proposition 2 (Realizability of the abstract trajectory) Let DTS  be a Д-grain abstraction of some real system DTS and consider an initial state x0 with its corre-sponding abstraction xQ For any trajectory of the abstraction S = {(x (0), u (0)), (x (1); U(1)); • • •, (x ('), u ('))} there exists a trajectory of the real system: S ={(x(0);Ug); (x(1);Uo); • • • ;   1), Uq), (x(ni); U1); (x(ni + 1); U1) • • • ; (П ] + n2   ^; U^; • • • ; (x(ni + П2 + ••• + n' 1),U' 1)), • • • ; (x(ni + П2 + ••• + n' - 1); U' 1} for which itholds that (x(n1 +n2 + ^ • ,+ni 1), x (i)) 2 Rx, Vi 2 {1 '}, provided that (u,,u (i)) 2 Ru, Vi 2 {0F - 1} Proof sketch We prove the statement by induction over ' Let x0 be the initial state of the system and u0 the input Then the abstractions xQ and uQ exist by property i) of Deflnition 2 Thus for ' = 0, the trajectory S = {(x (0), F(0))} exists and there is nothing else to prove Assume the statement holds for ' > 0 and prove it for ' +1 Let N' = n1 + • • •+n' 1 and let Fn(x) be the n-fold application of F to x, preserving u: Fk(x, u) = F(•••(F(x, u)•••); u) Since (u', U(')) 2 Ru by property ii) of Deflnition 2 there exists an integer k such that (Fk(x(N'), U'), F^(x^('), U('))) 2 Rx, since the input is kept at u(') Choosing n = k, we clearly have Fk(x(N'), U') = x(N' + n') and thus (x(n1+^ • •+ n'), x ('+1)) 2 Rx Moreover, Fj(x(N'), U') = x(N') for any j Tq(i — a) and Tp(i) *Actor:rExample(?RQP action ,?RQP user)): { 10 select { 11 on (sadmin = RQP user & slogin = RQP action): { 12 SA isAdmin := syes ; 13 RExample counter := rintAdd (RExample counter ,i1 ); 14 asAdmin(RU); 15 g 16 on (sguest = RQP user & slogin = RQP action): { 17 RExample counter := rintAdd (RExample counter ,i1 ); 18 retract asAdmin(RU); 19 g 20 on (slogout = RQP action): { 21 SA isAdmin := oNull; 22 retract asAdmin(RU); 23 g 24 on (syes = SA isAdmin & sreset = RQP action): { 25 RExample counter := i0 ; 26 a s s e r t onlyAsAdmin : asAdmin (RU ) ; 27 g 28 gggggg When verifying this model, the CL-ATSE model checker automatically produces the sequence of events in Listing 2 as a counter-example for our security requirement in short, an intruder (named i) logs in as admin, makes another login as guest in the same session, and finally resets the counter Listing 2 The Attack identified by CL-Atse *->* *->* *->* Actor (1) Actor (1) Actor (1) rExample( slogin , sadmin) rExample( slogin , sguest) rExample( sreset ,RQP user(54)) Following this interaction scenario, the reset can be per-formed even by a client currently logged in as guest, highlight-ing a logic security vulnerability The reason is that logins are 978-1-4799-3752-3 14 © 2014 iEEE 450 CSMR-WCRE 2014, Antwerp, Belgium Tool Demonstration Accepted for publication by iEEE © 2014 iEEE Personal use of this material is permitted Permission from iEEE must be obtained for all other uses, in any current or future media, including reprinting  republishing this material for advertising or promotional purposes, creating new collective works, for resale or redistribution to servers or lists, or reuse of any copyrighted component of this work in other works Fig 1 A Fragment of the iSummarize Meta-Model does a depth-first traversal of the call-graph and computes the automaton of each method such that a caller is processed after all its called methods This is required because our analysis is inter-procedural and we in-line the automaton of a called method into the automaton of the caller (recursion is currently not supported) Consequently, when the call-graph traversal is finished, we obtain a single automaton for the entry method of the component and implicitly, of the entire component To build the automaton of a method, JMODEX traverses the control-flow graph depth first, processing each instruction backwards from the exit to the method entry This determines all execution paths through the method together with their guards and updates jModex uses large-block encoding to collapse successive steps in the control flow graph and produce a model with fewer transitions Figure 2 shows various phases of building the automaton, based on the code in Listing 3 not tracked per session: variable SA isAdmin has the symbolic value syes set during the first login of the attack scenario (line 12) But an intruder can ask for a guest login immediately after an admin login Thus, SA isAdmin should be reset to oNull not only on admin logout, but also when a guest logs in iii Model Extraction with jModex To verify some security requirements of web applications using a checker like CL-Atse, we first need a model of that program We have built jModex, an Eclipse plug-in that automatically extracts an ASLan++ model from the implementation of a jSP Servlet-based web application in the following we briefly describe how jModex achieves its goal A iSummarize - Extraction of Behavioral Automata The first task performed by jModex is to capture the behavior of each component (i e , servlet) of the application in the form of an extended finite state machine A node in this automaton corresponds to a control point (e g , the entry   exit point of a component or a loop header) while an edge corresponds to an execution path within the component For each edge, the analysis determines a guard representing the condition which triggers the execution of the associated execution path, and a set of updates that capture the assignments to the relevant state variables on the same path Figure 1 presents a part of the meta-model used to represent these automata it captures the various kinds of expressions in the java language (e g , ProgramRelationalExpression) However, we do not analyze the libraries used by an appli-cation: special entities model the semantics of the servlet APi (e g , assigning using the value of a ProgramSessionAttribute or ProgramRequestParameter); SQL queries (e g , returning a ProgramDbValue from the database); or library functions abstracted away as uninterpreted (ProgramFunction) To build the automaton for a given component, jModex uses the WALA1 library to extract the component call-graph and the control-flow graphs of each method Next, jModex 1 http:  wala sourceforge net 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Listing 3 A Code Example public class Example { private static int counter = 0; public void jspSer vice ( ) { String action = request getParameter (" action"); if ("login" equals ( action )) { String user = request getParameter ("user" ); if ("admin" equals ( user )) request getSession () setAttribute ("isAdmin" , "yes" ); if ("admin" equals(user) | | "guest" equals(user)) counter = counter + 1; g else if (" reset " equals ( action )) { String isAd = (String) request getSession () getAttribute ("isAdmin" ); if ("yes" equals (isAd )) counter = 0; g else if ("logout" equals ( action )) request getSession () removeAttribute ("isAdmin" ); else ;    NOP — added for better understanding g g The analysis starts at the end of the method (line 19) and an initial automaton is built (see Figure 2A) it has a single edge with the true guard and no update it is easy to see that there are 4 ways in which line 19 can be reached: from the end of the branches at lines 5, 11, 16 and 18 Consequently, the initial edge will be split such that one copy propagates backward through each of these distinct points (see Figure 2B) Next, edge 1 is propagated backward through the false branch of the if in line 16 Since there are no operations, nothing happens Similarly, edge 2 is propagated backward through the true branch of the same condition This time jModex determines that a relevant state variable (i e , session attribute) has been changed (line 17) and the corresponding update is added to edge 2 After the propagation of both edges, jModex observes that the condition in line 16 is responsible for triggering the execution of edge 1 or 2 consequently, their guards are changed accordingly (see Figure 2c) Next, edge 3 is propagated backward through the true branch of the if in line 11 First, it will be split in two because inside this branch there are two possible sub-paths: on one jModex determines an update to a relevant state variable (counter reset) while on the other there are no updates The execution of these sub-paths is controlled by the condition in line 14 and thus their guards are modified accordingly Both 451 TRUE - TRUE   - From end of branch in 16 TRUE   - From end of branch in 18 2 3 TRUE  - From end of branch in 11 А X   , - From end of 1 4 branch in 5 EXiT B !("logout" equals(action))   "logout" equals(action)   SessionAttribute("isAdmin") = null 2 TRUE - From end of branch in 11 "reset" equals(action) & !("yes" equals(SessionAttribute("isAdmin")))   - !("reset" equals(action)) !("logout" equals(action))   "logout" equals(action)   SessionAttribute("isAdmin") = null 3' 2 "reset" equals(action) & "yes" equals(SessionAttribute("isAdmin"))   counter = 0 !("yes" equals(SessionAttribute("isAdmin"))) "logout" equals(action)     - SessionAttribute("isAdmin") = null 3 2 i 2) "logout" equals(RequestParameter("action")) |   SessionAttribute("isAdmin") = null !("logout" equals(action))   ) All the other cases 5 ’login" equals(RequestParameter("action")) & 4) "login" equals(RequestParameter("action")) & "guest" equals(RequestParameter("user"))   counter = counter + 1 5) "admin" equals(RequestParameter("user"))   counter = counter + 1; SessionAttribute("isAdmin") = "true" "yes" equals(SessionAttribute("isAdmin"))   counter = 0 3) "reset" equals(RequestParameter("action")) & "yes" equals(SessionAttribute("isAdmin"))   counter = 0 Fig 2 The Automaton Building Process edges are propagated backward to the beginning of the true branch of the condition in line 11, and jModex substitutes the occurrences of variable isAd on these edges with the value assigned to it in line 12 The result is shown in Figure 2D Next, JMODEX arrives at the jump statement corresponding to the condition in line 11 This condition must be true in order to execute edges 3' or 3" and false to trigger the execution of edge 1 or 2 Thus, their guards are modified accordingly Figure 2E shows that the guard of edge 2 has been simplified (e g , if action is the logout string, not("reset" equals(action)) is true and can be eliminated from the conjunction) This process continues until all edges reach the beginning of the method, as seen in Figure 2F All execution paths with the same updates are subsumed by a single edge in the model, with a guard that is the disjunction of the individual guards 1) Loops: For methods with loops, we cannot determine all execution paths through the method Consequently, we introduce an additional state control point in the automaton, associated with the loop header Moreover, an update to a relevant state variable may depend on other variables (including locals) updated within the loop Thus, these variables are also relevant and their updates must be captured The described algorithm is repeatedly applied for the loop until a fixed point is reached and the set of relevant variables no longer changes 2) infeasible paths: Some paths considered while building the automaton may in fact be non-executable For example, in Listing 3, the path going through lines 8 and 10 as a result of satisfying the right operand of the disjunction in line 9 is infeasible: the admin variable cannot be simultaneously equal to "admin" (to execute line 8) and not be equal to it (to evaluate the right operand of the short-circuiting disjunction) JMODEX handles such cases by trying to identify contradictions in guard formulas Additionally, JMODEX provides an APi to integrate satisfiability checkers for logical formulas 3) Limitations and Other Features: Currently, JMODEX cannot handle all Java constructs (e g , polymorphic calls, exceptional paths, collection usage, etc ) or every possible SQL query However, this does not hinder an initial evaluation of the tool to check the feasibility and usefulness of model extraction During this assessment, we identified that abstracting library or even application functions is critical to generating models that are compact enough to be handled by the model checkers We have thus extended jModex with user-defined specifiers, which enable analysts to describe programmatically how cer-tain methods (or even individual method invocations) should be analyzed during model extraction The specifier mechanism can be used to express the semantics of the JSP framework methods in terms of the JMODEX meta-model, and could thus be used to extend JMODEX for analyzing applications built with other development technologies We have also used specifiers to under-approximate the behavior of functions (e g , ignore filtering or sanitizing of strings) when searching for logical flaws which are independent of these aspects B iConvert - ASLAN++ Generation in the second analysis step, JMODEX reduces the au-tomaton graph of each component using a structural analysis algorithm, obtaining for each automaton a control tree This tree is expressed in terms of ASLAN++ control state-ments and describes how statements are combined to produce the semantics of the automaton operations We have defined translation schemas for each expression in the iSUMMARiZE meta-model; they are used to generate the ASLAN++ code for the guards and updates that fill the control tree For example, the automaton in Figure 2F can be reduced to an ASLAN++ select statement that non-deterministically selects a transition with a true guard Next, based on the translation schemas, jModex produces the code in lines 10 to 27 from Listing 1 (except the user-specified assertion), filling the on conditions 452 with the edge guards and the statement bodies with the edge updates Edges with no updates are eliminated if possible Finally, the ASLAN++ code of each component is inserted on a distinct branch of another select statement (e g , line 8 in Listing 1) The purpose of this select is to enable a user (including an intruder) to access different components in every possible order she can imagine Finally, everything is enclosed within the server infinite loop (e g , line 7 in Listing 1) iV EVALUATiON For an initial evaluation of JMODEX we have used the BookStore1 application in which we had manually detected a security vulnerability (later found to be already known2 3) The application has typical features for an on-line store (user registration, information updates, shopping cart, etc ) and it is developed using the JSP Servlet technology The security vulnerability is that a regular user can change the password of another user including that of the admin in the following we describe the steps we applied in order to identify this vulnerability using the models extracted with JMODEX We start by extracting a model for the Login and Myinfo components, which perform user login and personal informa-tion updates The corresponding JSPs have been converted in pure Java code using Tomcat 6’s translator, obtaining around 1500 lines of code We have also used jModex facilities to simplify the application model, reducing its size to aid the verifier Consequently, we have captured only those execution paths in which the request parameters exist (i e , they are not null in the application), we have considered some sanitizing functions to be identities, etc On a MacBook Pro computer (2 53 GHz intel Core i5, 8GB RAM) running OS X Mountain Lion, JMODEX extracts in less than 30 seconds a model with around 140 lines of ASLan++ code After initializing the model database and specifying the security requirement that a regular user should be able to modify only its entry in the database, we have verified the model using CL-ATSE Limiting the maximum execution count of each transition to 2, CL-Atse identified the attack in less than 10 seconds Thus, we have shown that the model extracted using JMODEX is sufficient to highlight the initial vulnerability Next, we inserted an additional check in the Myinfo component to eliminate the vulnerability After extracting the new model we re-ran the model checker, this time without finding any attack on the security property Moreover, on the corrected application, the initial attack that changes the admin password fails This confirms that JMODEX has correctly captured the behavior of the modified application in the new model V Related Work Several other tools analyze application code to detect secu-rity vulnerabilities caused by faulty application logic Waler uses dynamic analysis to identify likely invariants and ap-plies model checking over symbolic inputs to detect executions that may violate these invariants Waptec uses a constraint 2http:  web archive org web 20110430192101 http:  gotocode com  3http:  www securityfocus com bid 49910 exploit solver and dynamic analysis to identify executions triggered by user inputs that are rejected in the client side of the application but are incorrectly accepted by the server side in contrast, jModex only builds an application model; however, it is strongly linked to the model checkers used to verify its security properties (CL-Atse and SATMC ) it produces models expressible in their input specification language ASLAN++, and uses abstractions geared towards the features of this language and the checking algorithms Bandera has taken a similar approach of building models of java programs that can be analyzed by independent model checkers in comparison, jModex is not geared to-wards verification of concurrency and data structure properties, but produces models for model checkers that target security aspects Consequently, it needs to incorporate security domain knowledge (e g , about web applications and intruder actions), and generate models that can be efficiently checked Vi Conclusion We have presented jModex, a tool to automatically extract behavioral models for web applications The model is ex-pressed in the ASLAN++ language and can be further used in conjunction with a model checker to verify security properties initial evaluation has showed that the tool can extract models from small but realistic web applications, and that the extracted models can be used to identify security vulnerabilities As future work, we plan to address the current limita-tions presented in Section iii A special focus is to provide more powerful abstraction simplification mechanisms to ad-dress scalability issues raised by model checkers An important ability would be to start from the security requirement to be checked and automatically abstract away during model construction all details that are irrelevant for the analysis goal Acknowledgment This work has been supported by the European FP7-iCT-2009-5 project no 257876 SPaCioS — Secure Provision and Consumption in the internet of Services References P Bisht, T Hinrichs, N Skrupsky, and V N Venkatakrishnan, "WAPTEC: Whitebox analysis of web applications for parameter tampering exploit construction," in Proceedings, 18th ACM CCS ACM, 2011, pp 575-586 V Felmetsger, L Cavedon, C Kruegel, and G Vigna, "Toward automated detection of logic vulnerabilities in web applications," in Proceedings of the 19th USENiX Conference on Security, 2010, pp 143-160 M Turuani, "The CL-Atse Protocol Analyser," in Proceedings ofRTA’06, ser LNCS, vol 4098, 2006, pp 277-286 A Armando and L Compagna, "SAT-based model checking for security protocol analysis," int J of information Security, vol 7, pp 3-32, 2008 M Btichler, J Oudinet, and A Pretschner, "SPaCiTE - web application testing engine," in Proceedings of Fifth iCST, 2012, pp 858-859 D Beyer, A Cimatti, A Griggio, M E Keremoglu, and R Sebastiani, "Software model checking via large-block encoding," in Proceedings of Ninth FMCAD iEEE, 2009, pp 25-32 S S Muchnick, Advanced Compiler Design implementation Morgan Kaufmann Publishers, 1997 J C Corbett, M B Dwyer, J Hatcliff, S Laubach, C S Pasareanu, Robby, and H Zheng, "Bandera: extracting finite-state models from Java source code," in Proceedings of 22nd iCSE ACM, 2000, pp 439-448 453 Marius Minea marius@cs upt ro http:  cs upt ro  marius curs lsd  25 septembrie 2017 CORE 61C imagine: https:  hkn eecs berkeley edu courseguides Assodation for , Ung Madiinery Advandng Computing as a Science & Profession 4HEEE " iEEE ©computer society http:  www acm org education curricula-recommendations Knowledge Area CS2013 CS2008 Core CC2001 Core Tierl Tier2 AL-Algorithms and Complexity 19 9 31 31 AR-Architecture and Organization 0 16 36 36 CN-Computational Science 1 0 0 0 DS-Discrete Structures 37 4 43 43 GV-Graphics and Visualization 2 1 3 3 HCi-Human-Computer interaction 4 4 8 8 LAS-information Assurance and Security 3 6 - - iM-information Management 1 9 11 10 iS-intelligent Systems 0 10 10 10 NC-Networking and Communication 3 7 15 15 OS-Operating Systems 4 11 18 18 PBD-Platform-based Development 0 0 - - PD-Parallel and Distributed Computing 5 10 - - PL-Programming Languages 8 20 21 21 SDF-Software Development Fundamentals 43 0 47 38 SE-Software Engineering 6 22 31 31 SF-Systems Fundamentals 18 9 - - SP-Social issues and Professional Practice 11 5 16 16 Total Core Hours 165 143 290 280 Ce invatam la acest curs? iNPUT x modulul de baza pentru calcule OUTPUT f(x) : grafuri, retele (sociale), planificare (relatii de precedenta), programare concurenta paralela (relatii de dependenta), lucrul cu colectii de obiecte (DOES NOT ALLOW duplicate elements) (DOES NOT ALLOW duplicate keys) (peimits nuli values but only once as (Perinits nuli values) duplicates are not allowed) (a) (b) imagine: https:  way2java,corn collections java-collections-interfaces-hierarchy  : cum definim simplu prelucrari complexe si rezolvam probleme prin subprobleme mai mici   k   k i   к—1   1 "г 1 0 q = ->p V q -i(a V Ь) = ->a V 3xP(x) = ^Vx^P(x) cum exprimam afirmatii pentru definitii riguroase, specificatii in software, cum afirmatii pentru a arata ca un algoritm e corect cum formule logice pentru a gasi solutii la probleme (ex programare logica) a, b : sisteme cu logica de control simpla b a b : prelucrari simple de text (a|b)*aba(a|b)* : sintaxa limbajelor de programare ifStmt ::= if ( Expr ) Stmt else Stmt : reprezentari   prelucrari de expresii arbori de cautare, etc * 2 3 7 4 : vizualizarea relatiilor parcurgeri, drumuri minime, imagine: https:  en wikipedia org wiki Social network Nu studiem domeniul numere reale, infinitezimale, limite, ecuatii diferentiale vezi: analiza matematica Studiem notiuni obiecte care iau valori distincte, (intregi, valori logice, relatii, arbori, grafuri, etc ) Matematici discrete folosind Bazele informaticii notiunile de baza din stiinta calculatoarelor unde si cum se , mai ales in => cum sa Vom lucra cu un limbaj in care notiunea fundamentala e ilustreaza concepte de matematici discrete (liste, multimi, etc ) (in cateva linii de cod se pot face multe) => ajuta sa evitam erori Cursul e vom discuta ce e celui de programare imperativa (in C) , si ce e (si de ce) Limbajul ML: dezvoltat la Univ Edinburgh (anii ’70) impreuna cu un demonstrator de teoreme (logica matematica) Conceptele din programarea functionala au influentat alte limbaje: JavaScript, Python, Scala; ( NET) e foarte similar cu ML Exemplu: adoptarea functiilor anonime (lambda-expresii) 1930 A-calcul (Alonzo Church) - pur teoretic 1958: LiSP (John McCarthy) 1973: ML (Robin Milner) 2007: C# v3 0 2011: C++11 2014: Java 8 "A language that doesn't afFect the way you think about programming, is not worth knowing " A lan Perlis Caml: un dialect de ML, cu interpretorul si compilatorul OCaml http:  ocaml org iffi iffli BROWN UNiVERSiTY OF CAMBRiDGE HARVARD UNiVERSiTY 6S a Fiind date multimile si , o care element din A ii corespunde e o asociere prin element din B imagine: http :  en wikipedia org wiki File: Total function svg (codomeniul) asocierea corespondenta propriu-zisa (legea, regula de asociere) f : , f(x) = x + 1 sunt functii distincte! si , f(x) = x + 1 in limbajele de programare, domeniul de definitie si de valori corespund (intregi, reali, booleni, enumerare, nu asociaza o valoare fiecarui element asociaza mai multe valori unui element imagine: http:  en wikipedia org wiki File:Partial function svghttp:  en wikipedia org wiki File:Multivalued function svg in limbajele de programare, o functie exprima un primeste o valoare ( ) si produce ca alta valoare iNPUTx FUNCTiON f: OUTPUT f(x) imagine: http:  en wikipedia org wiki File :Function machine2 svg Cel mai simplu, definim functii astfel: X = X + 1 "fie functia f de argument x, cu valoarea x + 1" Putem defini si identificatori cu alte valori (de ex numerice): = 3 defineste identificatorul у cu valoarea 3 (un intreg) in general nume = expresie (asociaza) nume cu valoarea expresiei date in diagrame, functiile nu au neaparat nume: functia care asociaza 1 lui 0, etc Putem scrie si in OCarnl: x -> X + 1 o reprezentand o functie Ca la orice expresie, putem asocia un nume cu valoarea expresiei: = x -> x + 1 e la fel ca x = x + 1 Ultima scriere e mai concisa si apropiata celei din matematica Prima scriere ne arata ca o functie e si ea o (ca si intregii, realii, etc ) si poate fi folosita la fel cu alte valori Daca am definit o functie: x = x + 3 o apelam (calculam valoarea) scriind functia, apoi argumentul: f 2 interpretorul raspunde: - : int = 5 avem o valoare fara nume (-), care e un intreg, si are valoarea 5 in ML, functiile se apeleaza fara paranteze! in matematica, folosim paranteze: ca sa grupam calcule care se fac intai: (2 + 3) * (7 — 3) ca sa identificam argumentele functiilor: f(2) in ML, folosim paranteze doar pentru a grupa (sub)expresii Putem scrie f(2), la fel ca ((2))+(3), dar e inutil si derutant Diverse limbaje au reguli de scris diferite (sintaxa) Putem apela direct si o functie anonima: ( x -> x + 3) 2 (cu paranteze pentru a grupa expresia functiei anonime) Daca definim interpretorul OCarnl val f : int -> int x = x + 1 definitia si raspunde: Matematic: f e o functie de la intregi la intregi in program: f e o functie cu argument de intreg (int) si rezultat de intreg (domeniul si codomeniul devin in programare, un de date e o multime de valori, impreuna cu niste operatii definite pe astfel de valori int -> int e tot un tip, al functiilor de argument intreg cu valoare intreaga in ML, tipurile pot fi deduse ( ): pentru ca la x se aplica +, compilatorul deduce ca x e intreg Pentru reali, am scrie x = x + 1 cu punct zecimal pentru reali, si in operatori: etc Fie abs : Z —> Z daca x > O altfel (x 0) x = x >= 0 x - X if expri then expr? else ехргз e o Daca lui expri da valoarea {adevarat) valoarea expresiei e valoarea lui expr2, altfel e valoarea lui exprj expr2 si ехргз trebuie sa aibe (ambele intregi, reale, ) in alte limbaje (C, Java, etc ) si ramurile lui sunt in ML, e o ML nu are instructiuni, ci doar (care sunt evaluate), si ( ) care dau nume unor valori Vom lucra mai tarziu si cu definitii de tipuri si de module : O functie f : А —> В е la argumente diferite daca asociaza valori diferite Riguros: pentru orice xi,%2 G A, *i 7^ *2 => f(xi) Ф  (*2) imagine: http:  en wikipedia org wiki File:injection svg http:  en wikipedia org wiki F ile:Surjection svg in locul conditiei X1,X2 G A Xi 7^ X2 => f(xi) 7^ f(x2) putem scrie echivalent: f(xi) = ^(хг) => xi = X2 daca valorile sunt egale, atunci argumentele sunt egale afirmatiei de mai sus: negam premisa si concluzia, si le inversam: P Q o ->Q => ->P in logica, faptul ca o afirmatie e echivalenta cu contra pozitiva ei ne permite - presupunem concluzia falsa - aratam ca atunci premisa e falsa, absurd (stim ca e adevarata) - deci concluzia nu poate fi falsa, e adevarata E la fel sa scriem xi, X2 G A xi = X2 => f(xi) = ^(хг) ? Nu! Oricare ar fi functia, dand acelasi argument ia aceeasi valoare! (e o proprietate de baza a egalitatii si substitutiei) Daca multimile A si В sunt finite, si f e injectiva, atunci |Д| 1 putem construi f sa duca doua elemente din Д in aceeasi valoare din B) Demonstram prin inductie dupa n ca daca |A| >   B  = n, f : A —> В nu poate fi injectiva Cazul de baza: n = 1, В = {bi} Cum A are cel putin 2 elemente, avem f(ai) = ^(аг) = bi (unica posibilitate), deci f nu e injectiva Cazul inductiv: fie |B| = n + 1 si bn+i G B Daca pentru cel putin 2 elemente din Д, f ia valoarea bn+i, f nu e injectiva Altfel, eliminam din A aceste elemente (cel mult 1), si codomeniul devine B' = B  {bn+i} Ramanem cu |Д'| >  B'  = n Din ipoteza inductiva, cel putin doua elemente din A' au valori egale pentru f Similar, principiul lui Dirichlet: daca impartim n + 1 obiecte in n categorii exista cel putin o categorie cu mai mult de un obiect : O functie f : А —> В е daca pentru fiecare у G В exista un x G A cu f(x) = y Exemple: functie surjectiva si nesurjectiva imagine: http :  en wikipedia org wiki File:Surjection svg imagine: http:  en wikipedia org wiki File:injection svg Daca A si В sunt finite si f : A —> В e surjectiva, atunci |A| >  B  Nu neaparat invers! (construim f sa nu ia ca valoare un element anume din B, daca  B  > 1) Putem transforma o functie ne-surjectiva intr-una surjectiva prin restrangerea domeniului de valori: fi : R —> R, fi(x) = x2 nu e surjectiva, dar f> : R —> [0, oo) (restransa la valori nenegative) este in programare, e util sa definim functia cu tipul rezultatului cat mai precis (daca e posibil, surjectiva) Astfel, cand citim un program, stim deja din tipul functiei ce valori poate returna, fara a trebui sa-i examinam codul : O functie care e injectiva si surjectiva se numeste O functie bijectiva f : A —> В pune in corespondenta elementele lui A cu cele ale lui B Pentru functie, din definitie, la fiecare x G A corespunde un unic у G В cu f(x) = у Pentru o functie , si invers: la fiecare у € В corespunde un unic x G A cu f(x) = у Daca multimile A si В sunt finite, si f e bijectiva, atunci |Д| =   B  imagine: http:  en wikipedia org wiki File: Bijection svg Daca A si В sunt multimi finite exista | B ІДІ functii de la A la B Notatie: |Д| = cardinalul lui A (numarul de elemente) Demonstratie: prin dupa |Д| Daca o propozitie P(n) depinde de un numar natural n, si 1) ( ) P(0) e adevarata 2) ( ) pentru orice n > 0, P(n) => P(n + 1) atunci P(n) e adevarata pentru orice n Multimea functiilor f : A —> В se noteaza uneori BA Notatia ne aminteste ca numarul acestor functii e |B ІДІ Fie functiile f : A —> si g : —> C Compunerea lor este functia g o f : A —> C, (g o f)(x) = g(f(x)) Putem compune gof doar cand codomeniul lui f = domeniul lui g i imagine: http:  en wikipedia org wiki File:Compufun svg iNPUT x=3 Rezultatul functiei f devine argument pentru functia g Prin compunere, construim functii complexe din functii mai simple OUTPUT g(f(x))=10 imagine: http:  en wikipedia org wiki File:Function machine5 svg Compunerea a doua functii e (f o g) o h = f O (g O  7) : fie x oarecare din domeniul lui h Atunci: (( Prelucram formulele atent, rescriindu-le conform definitiei Compunerea a doua functii e neaparat Puteti da un exemplu pentru care fog^gof? Matematic, scriem de ex f : Z x Z —> Z, f(x,y) = 2x + у — 1 in ML, enumeram doar argumentele (fara paranteze, fara virgule): x у = 2*x + у - 1 iar interpretorul raspunde val f : int -> int -> int = f e o functie care ia un intreg si inca un intreg si da un intreg Sa fixam primul argument, de ex x = 2 Obtinem: f(2,y) = 2 • 2+ y — 1 Am obtinut o functie de un argument (y), singurul ramas nelegat in ML, evaluand f 2 (fixand x = 2), interpretorul raspunde: - : int -> int = Deci, f e de fapt o functie cu argument x, care returneaza o Aceasta ia argumentul у si returneaza rezultatul numeric Definim o functie comp care compune doua functii: f g x = f (g x) Echivalent, puteam scrie: f g = x -> f (g x) adica comp f g e functia care primind argumentul x returneaza f(g(x)) interpretorul indica val comp : (’a -> ’b) -> (’c -> ’a) -> ’c -> ’b = ’a e tipul lui g: duce pe x in tipul ’a ’a -> ’b e tipul lui f: duce tipul ’a in tipul ’b (codomeniul lui g e domeniul lui f) ’b e tipul rezultatului Putem apela comp ( x -> 2*x) ( x -> x + 1) 3 care da 2 * (x + 1) pentru x = 3, adica 8 Operatorii (ex matematici, +, *, etc ) sunt tot niste functii: ei calculeaza un rezultat din valorile operanzilor (argumentelor) Diferenta e doar de : scriem operatorii intre operanzi ( ), iar numele functiei inaintea argumentelor ( ) Putem scrie in ML operatorii si prefix: (+) 3 4 paranteza deosebeste de operatorul + unar = (+) 1 addl 3 la fel ca: (+) 1 3 addl e functia care adauga 1 la argument, deci x -> x + 1 Pe orice multime A definim  Уд : A —> A,  Уд(х) = x (notata adeseori si 1д) : 0 functie f : A —> В e inversabila daca exista o functie : В —> A astfel incat o f = id   si f o = ide- 0 functie e inversabila daca si numai daca e Demonstram: Daca f e inversabila: pentru у G В oarecare, fie x = f 1(y) Atunci f(x) = fr(fr 1(y)) = y, deci f e surjectiva daca f(xi) = f(%2)> atunci f 1(f(xi)) = f 1(f(x2)), deci xi=X2 , daca f e bijectiva: - f e surjectiva => pentru orice у € В x G A cu f(x) = у - f fiind injectiva, daca f(xi) = у = ^(хг), atunci xi = X2 Deci : В —> A, f 1(y) = acel x astfel incat f(x) = у e o functie bine definita, f 1(f(x)) = x, si  г( г 1(у)) = у Fie f : A -+ B Daca S C A, multimea elementelor f(x) cu x G S se numeste lui S prin f, notata f(S) Daca T CB, multimea elementelor x cu f(x) G T se numeste lui T prin f, notata f 1(T) in general, f 1(f(S)) D S aplicand intai functia si apoi preimaginea (incercand sa aflam din ce argument a provenit) se pierde precizie (in general, nu orice calcul e reversibil) Pentru o functie inversabila, inversa nu e neaparat Fie multimea Z* a resturilor nenule modulo p, cu p prim Ea formeaza un cu operatia de inmultire mod p Teorema lui Fermat: ap 1 = 1 mod p pentru orice a E Z* Se mai stie ca daca p e prim, grupul Z* are cel putin un adica un element g astfel incat sirul g,g2,g3, ,gp 1 parcurge toata multimea Z* De exemplu, 3 e generator in Z7*: sirul 3k mod 7 e 3, 2,6,4,5,1 inseamna ca functia f : Z* —> Z*, f(x) = gx mod p e o (si inversabila) Nu se cunoaste insa un mod eficient de a o inversa cand p e mare (problema logaritmului discret) => e folosita in criptografie Prin functii exprimam calcule in programare Operatorii sunt cazuri particulare de functii Domeniile de definitie si valori corespund din programare Cand scriem compunem functii, tipurile trebuie sa se potriveasca, in limbajele functionale, functiile pot fi manipulate ca orice valori Functiile pot fi argumente si rezultate de functii Functiile de mai multe argumente (sau de tuple) pot fi rescrise ca functii de un singur argument care returneaza functii Sa despre functii injective, surjective, bijective, inversa bile Sa functii cu anumite proprietati Sa functiile definite pe multimi finite (cu proprietati date) Sa functii simple pentru a rezolva probleme Sa identificam unei functii introducere introducere - dezvoltat in 1972 la de Dennis Ritchie - folosit pentru scrierea de sisteme de operare si utilitare (C dezvoltat initial sub UNiX, apoi UNiX a fost rescris in C) carte: Brian Kernighan, Dennis Ritchie: (1978) Un limbaj vechi, dar in evolutie - standardul ANSi C, 1988 (American National Standards institute) - versiunea curenta: C99 (standard iSO 9899) - foarte : acces direct la reprezentarea binara a datelor, libertate in lucrul cu memoria, buna interfata cu hardware - limbaj , baza mare de cod (biblioteci pentru multe scopuri) - : compilatoare bune, genereaza cod compact, rapid - : foarte usor de facut ! Programarea calculatoarelor Curs 1 Marius Minea - niste date de intrare - le prin niste calcule (matematice) - (scrie) niste rezultate in matematica, efectuam calcule cu ajutorul - diverse functii (sin, cos, etc ) - functii noi (depinzand de problema) - functiile existente si definite de noi - si le intr-o anumita ordine Toate aceste aspecte le intalnim si in programare Programarea calculatoarelor Curs 1 Marius Minea introducere introducere Exemplu: functia de ridicare la patrat pentru intregi int sqr(int x) sqr : 2Z —> 2Z r   return x * * x; Sgr(x) = X • X unei functii contine: - functiei: specifica un domeniu de valori (intregi), numele functiei si parametrii acesteia (un singur parametru, intreg) - functiei: aici, o singura (return) cu o care da valoarea functiei (pornind de la parametri) Limbajul are precise de scriere ( ): - diversele elemente scrise intr-o anumita ; - se folosesc pentru a le delimita precis: ( ) ; { } Ridicarea la patrat pentru numere reale float sqrf (float x) sqrf iR —"iR   return x * x; sgrf(x)=x-x - o alta functie decat cea dinainte: alt domeniu de definitie si de valori - trebuie sa-i dam alt nume daca o folosim in acelasi program - strict vorbind si operatia * e alta, fiind definita pe alta multime Cuvintele int, float denota Un e o impreuna cu un permise pentru aceste valori Alt tip pentru reali: (dubla precizie) recomandabil fata de float (si folosit de functiile standard) Programarea calculatoarelor Curs 1 Programarea calculatoarelor Curs 1 Marius Minea introducere Exista diferente importante intre tipuri numerice in C si matematica, -in matematica, Z c iR, ambele sunt infinite, iR e densa -in C, int si float sunt tipuri finite; realii au precizie finita numerice au tip determinat de modul de scriere: 2 e un intreg, 2 0 e un real putem scrie un real in notatie stiintifica: i 0e-3 in loc de o ooi sunt echivalente scrierile 1 0 si 1 respectiv 0 1 si 1 - unele operatii sunt diferite pentru intregi si reali: e ii! 7   2 da valoarea 3, pe cand 7 0   2 0 da valoarea 3 5 -7   2 da valoarea -3, deci la fel cu - (7   2) Operatorul 9 5 este 1 -9 5 este -1 (scris %) e definit doar pentru intregi 9 % 5 este 4 9   -5 este -1 9 % -5 este 4 -9 % 5 este -4 -9   -5 este 1 -9 % -5 este -4 semnul restului e acelasi cu semnul deimpartitului e valabila egalitatea a == a   b * b + a % b (ecuatia impartirii cu rest) Programarea calculatoarelor Curs 1 Marius Minea introducere 6 - : au un inteles predefinit (nu poate fi schimbat) Exemple: instructiuni (return), tipuri (int, float, doubie), etc - (de ex sqr, x) alesi de programator pentru a denumi functii, parametri, variabile, etc Un identificator e o secventa de caractere formata din litere (mari si mici), liniuta de subliniere si cifre, care nu incepe cu o cifra si nu este un cuvant cheie Exemple: x3, al2 34, exit, main, printf, intl6 t - (numerice: -2, 3 14; mai tarziu: caractere, siruri) - , cu diverse semnificatii: * e un operator ; delimiteaza sfarsitul unei instructiuni parantezele ( ) grupeaza parametrii unei functii sau o subexpresie acoladele { } grupeaza instructiuni sau declaratii etc Programarea calculatoarelor Curs 1 Marius Minea introducere introducere Exemplu: discriminantul ecuatiei de gradul ii: a   x2 + b   x + c = 0 float discrim(float a, float b, float c) { return b*b-4*a*c; intre parantezele rotunde ( ) din antetul functiei putem specifica oricati parametri, fiecare cu tipul propriu, separati prin virgula Programarea calculatoarelor Curs 1 Pana acum, am functii, fara sa le folosim Valoarea unei functii poate fi folosita intr-o expresie cu aceeasi sintaxa ca si in matematica: functie(parametru, parametru,    , parametru) Exemplu: in discriminantul dinainte, puteam scrie: return sqrf(b) - 4 * a * c; Sau putem defini: int cube(int x) { return x * sqr(x); iMPORTANT: inainte de a folosi orice identificator (nume) in C, el trebuie sa fie (trebuie sa stim ce reprezinta) =4" Exemplele sunt corecte daca sqrf respectiv sqr sunt definite inainte de discrim, respectiv cube in program Programarea calculatoarelor Curs 1 Marius Plinea introducere introducere 10 int main(void) { return 0; - cel mai mic program: nu face nimic ! - orice program contine functia si e executat prin apelarea ei (programul poate contine si alte functii) -in acest caz: functia nu are parametri ( ) void e un cuvant cheie pentru tipul vid (fara nici un element) - cf standard: main returneaza un cod intreg catre sistemul de operare (conventie: 0 pt terminare cu succes,    0 pt cod de eroare) Programarea calculatoarelor Curs 1  * Acesta este un comentariu *  int main(void)    comentariu pana la capat de linie {  * Acesta e un comentariu pe mai multe linii obisnuit, aici vine codul programului *  return 0; - programele pot contine comentarii, inscrise intre  * si *  sau incepand cu    si terminandu-se la capatul liniei - orice continut intre aceste caractere nu are nici un efect asupra generarii codului si executiei programului - programele comentate - pentru ca un cititor sa le inteleaga (altii, sau noi, mai tarziu) - ca documentatie si specificatie: functionalitate, restrictii, etc - ce reprezinta parametrii functiilor, rezultatul, variabilele, ce conditii trebuie indeplinite, cum se comporta la eroare Programarea calculatoarelor Curs 1 Marius Mlinea introducere 11 12 #include int main(void) { printf("hello, world! n");    tipareste un text return 0; - printf (de la "print formatted"): o functie standard (N B : printf nu este instructiune sau cuvant cheie) - e apelata aici cu un parametru sir de caractere - constantele sir de caractere: incluse intre ghilimele " " -  n este notatia pentru caracterul de linie noua - prima linie e o , include fisierul stdio h cu functiilor standard de intrare   iesire - = informatiile (nume, parametri) necesare pentru folosire - (codul obiect, compilat): intr-o biblioteca din care compilatorul ia cele necesare pentru generarea programului executabil Programarea calculatoarelor Curs 1 Marius Mlinea #include #include int main(void) { printf("cos(0) = "); printf("%f", cos(0)); return 0; Pentru a tipari valoarea #include int sqr (int x) { return x * x; }  int main(void) { printf("2 ori -3 la patrat e "); printf("%d", 2 * sqr(-3)); return 0; unei expresii, printf ia doua argumente: - un sir de caractere (specificator de format): %d (intreg, decimal), %f (real, floating point) - expresia, al carei tip trebuie sa fie compatibil cu cel indicat (verificarea cade in sarcina programatorului ii!) : instructiunile unei functii se executa una dupa alta - exceptii: instructiunea return incheie executia functiei (dupa ea nu se mai executa nimic) Programarea calculatoarelor Curs 1 Mlarius Mlinea introducere 13 introducere 14 ads(x) =   X X > 0 4 ' | -x altfel Cu cele discutate pana acum, nu putem defini aceasta functie in C Valoarea functiei nu e data de o singura expresie, ci de una din doua expresii diferite (x sau -x), in functie de o conditie (x > 0 sau nu) =4" e necesara o facilitate de limbaj pentru a decide valoarea pe care o ia o expresie in functie de valoarea unei conditii (adevarat fals) Programarea calculatoarelor Curs 1 O in C are sintaxa: conditie ? exprl : expr2 - daca conditia e adevarata, se evalueaza doar exprl, si intreaga expresie ia valoarea acesteia - daca e falsa, se evalueaza doar expr2 si intreaga expresie ia valoarea acesteia int abs(int x) { return x >= 0 ? x : -x;    operator minus unar Operatori de comparatie in C: == (egalitate), 1= (diferit), , >= iMPORTANT! Testul de egalitate in C e == si nu = simplu ii! Obs : Functia abs exist ca functie standard, declarata in stdlib h Programarea calculatoarelor Curs 1 Marius Plinea introducere sgn 2Z —* { —1,0, 1} Spn(x) = ( daca x 0) -1 daca x = 0 altfel (x > 0) 0 1 Chiar cu operatorul conditional nu putem transcrie functia direct in C (el permite doar decizia cu doua ramuri (adevarat fals), nu cu un numar mai mare de conditii   ramuri) =4" trebuie sa descompunem calculul functiei sgn (de fapt decizia asupra valorii parametrului x) - mai mici: principiu foarte important in rezolvarea de probleme Rescriem functia cu o singura decizie in fiecare punct: int sgn (int x) return x 0) -1 daca x = 0 altfel (x > 0) 0 1 - putem grupa arbitrar de multi operatori ? : - exprl si expr2 pot fi la randul lor expresii conditionale -intr-o expresie scrisa corect, un : corespunde univoc unui ? Programarea calculatoarelor Curs 1 Marius Plinea Programarea calculatoarelor Curs 1 Plarius Plinea introducere introducere 18 #include int sqr(int x) f printf("Patratul lui %d e %d n", x, x*x); x6 = (x • x2)2 return x * x; in ce ordine se scrie pe ecran ? int main(void) { printf("2 la a 6-a e %d n", Patratul lui 2 e 4 sqr(2 * sqr(2))); Patratul lui 8 e 64 return 0; 2 la a 6-a e 64 in C, transmiterea parametrilor la functii se face - se (calculeaza valoarea) toate argumentele functiei - valorile se atribuie la (numele din def fct ) - apoi se incepe executia functiei cu aceste valori in exemplu: programul incepe cu executia lui main, deci tiparirea printf - printf are nevoie de valoarea argumentelor sale Prima se stie (o ), a doua trebuie calculata' sqr (2 * sqr(2)) - pentru a efectua apelul exterior al lui sqr trebuie stiut argumentul, adica 2 * sqr(2) Deci se efectueaza intai apelul interior, sqr(2) =4" ordinea: sqr(2), apoi sqr(8), apoi printf din main Cum s-ar mai putea altfel, dar in C: : functia incepe executia si Tsi calculeaza argumentele la nevoie - printf ar tipari intai 2 la puterea 6 e, apoi Ti trebuie valoarea - ar apela sqr exterior care scrie Patratul lui, apoi Ti trebuie x - ar apela sqr(2) care scrie Patratul lui 2 e 4, returneaza 4, etc : se substituie argument pentru parametrii functiei - din printf s-ar apela sqr exterior cu 2 * sqr(2) - pt a calcula (2*sqr(2))*(2*sqr(2)) s-ar apela sqr(2) de doua ori => in C, o functie calculeaza numai cu , niciodata cu Programarea calculatoarelor Curs 1 Mlarius Mlinea Programarea calculatoarelor Curs 1 Plarius Plinea introducere introducere - 2 5 ore de curs: miercuri 8-9:30, marti 12:30-13:30 (R611) - 2 ore de laborator (B426) prep ing Gabriela Bobu, drd ing Dan Ciresan, prep ing Elena Doandes Scopul cursului: din voi sa programati bine in C - laborator cu probleme realiste - experienta de la laborator esentiala pentru examen Marius Minea 5 octombrie 2005 - 60% examen 1 2 partial (30%), 1 2 final (30%) - 40% activitate pe parcurs (laborator) Consultatii: la birou (B 531) - o ora fixa pe saptamana (libera in orar): Luni 11-12 ? -sau stabiliti o alta ora prin   (marius@cs utt ro) Pagina de curs: la http:  www cs utt ro  marius curs pc2 - invatati materia dupa fiecare curs - spuneti ce e dificil de inteles (si cum ati invata mai bine) - veniti la consultatii in caz de nelamuriri - invatati impreuna prezentati solutiile altora (modificate sau nu) ca ale voastre Programarea calculatoarelor Curs 1 Marius Minea - carti, articole, pagini de web, idei ale altora - oriunde: in teme, proiecte, prezentari, lucrarea de diploma Programarea calculatoarelor Curs 1 Marius Minea introducere introducere -conceptul de compilator: descris prima data de Grace Hopper (1952) - 1954-1957: limbajul si compilatorul FORTRAN (John Backus, iBM) - 1958: LiSP (LiSt Processing, John McCarthy, la MiT) - 1959: COBOL (Common Business Oriented Language) dezvoltat de CODASYL: Committee on Data Systems Languages - 1960: ALGOL 60: limbaj structurat, a inspirat multe altele - 1964: BASiC (John Kemeny, Tom Kutrtz; la Dartmouth) - 1967: SiMULA (Ole-Johan Dahl, Kristen Nygaard): primul limbaj orientat pe obiecte i - 1968: Edsger W Dijkstra: "GO TO Considered Harmful" - principiile programarii structurate - 1971: PASCAL (Niklaus Witrth); ulterior MODULA-2 Programarea calculatoarelor Curs 1 Marius Minea - dezvoltat si implementat in 1972 la АТ&Т Bell Laboratories de Dennis Ritchie http:  cm bell-labs com cm cs who dmr chist html - contextul: evolutia conceptului de (ALGOL 68 -+ BCPL —> В —> C) - necesitatea unui limbaj pentru (legatura stransa cu dezvoltat la Bell Labs) - C dezvoltat initial sub UNiX; in 1973, UNiX rescris in totalitate in C - cartea de referinta: Brian Kernighan, Dennis Ritchie: (1978) -in 1988 (vezi K&R editia ii) limbajul a fost standardizat de ANSi (American National Standards institute) - dezvoltari ulterioare: C99 (standard iSO 9899) Programarea calculatoarelor Curs 1 Marius Minea - produce un cod (compact in dimensiune, rapid la rulare) apropiat de eficienta limbajului de asamblare (fiind un limbaj relativ simplu, cu compilatoare mature) - permite programarea , apropiat de hardware acces la reprezentarea binara a datelor mare libertate in lucrul cu memoria foarte folosit in programarea de sistem, interfata cu hardware - limbaj de programare (functii, blocuri) - limbaj de nivel : tipuri, operatii, instructiuni simple fara facilitatile complexe ale limbajelor de nivel (foarte) inalt (nu: tipuri multime, concatenare de siruri, etc ) - => pericol mai mare de erori conversii implicite si explicite intre tipuri, ex char e tip intreg, etc Programarea calculatoarelor Curs 1 Marius Minea introducere introducere introducere Pascal Pascal litere mari si mici: la fel declaratii in ordine: const, type, subprograme, program principal proceduri si functii integer real boolean varl, var2 : tip; nume: array [min max] of tip; diferite!! (case sens t Ve) declaratii in orice ordine prog principal = functia main functii (pot returna si nimic) int float, double (precizii diferite) se foloseste int (valori 0 si 1) tip varl, var2 ; tip nume [lung] ; indici de la o la lung - 1 begin end ; e separator de instructiuni if conditie then instr while conditie do instr repeat instr until COnd for cnt := min to max do instr nume fct := expr { } sau (+ *) { } ; e terminator de instructiuni if conditie instr while conditie instr do instr while for (expJnit; exp test; expJncr) instr return expr ;  * *  sau    Programarea calculatoarelor Curs 1 Programarea calculatoarelor Curs 1 Marius Minea void main(void) { } - cel mai mic program: nu face nimic ! - orice program contine functia si e executat prin apelarea ei (programul poate contine si alte functii) -in acest caz: functia nu returneaza nimic (primul ), si nu are parametri (al doilea ) Cf standard: main returneaza un cod intreg catre sistemul de operare (conventie: 0 == terminare cu succes, != 0: cod de eroare) int main(void) return 0; } Discutam ulterior: main poate avea parametri (argumentele liniei de comanda) Programarea calculatoarelor Curs 1 Marius Minea C introducere 10  + Acesta este un comentariu +  int main(void)    comentariu pana la capat de linie  * Acesta e un comentariu pe mai multe linii obisnuit, aici vine codul programului *  return 0; } - programele pot contine , inscrise intre  * si *  sau incepand cu    si terminandu-se la capatul liniei (ca in C++) - orice continut intre aceste caractere nu are nici un efect asupra generarii codului si executiei programului - programele comentate - pentru ca un cititor sa le inteleaga (altii, sau noi, mai tarziu) -ca documentatie si specificatie: functionalitate, restrictii, etc - ce reprezinta variabilele, parametrii functiilor, rezultatul, ce conditii sunt necesare, cum se comporta la eroare, etc Programarea calculatoarelor Curs 1 Marius Minea introducere 11 #include int main(void) printf("hello, world! n");    tipareste un text return 0; } - prima linie: obligatorie pentru orice program care citeste sau scrie = o , include fisierul stdio h care contine (NU implementarea) functiilor standard de int rare iesi re = informatiile (nume, parametri) necesare compilatorului pt a le folosi - implementarea (cod obiect, compilat): intr-o biblioteca inclusa (linkeditata) la compilarea programului utilizator -printf ("print formatted"): o functie standard - N B : printf nu este o instructiune sau cuvant cheie - e apelata aici cu un parametru sir de caractere - sirurile de caractere: incluse intre ghilimele duble " -  n este notatia pentru caracterul de linie noua Programarea calculatoarelor Curs 1 Marius Minea introducere 12 int main(void) int sum;    declaram o variabila intreaga int a = 2, b;    o variabila initializata, alta nu b = 3; sum = a + b;    semnul de atribuire in C este = return 0; } - o variabila trebuie (cu tipul ei) inainte de folosire - poate fi optional la declarare - cateva tipuri standard: caracter char, intreg int, real float - corpul unei functii formeaza un , intre { si } - contine , urmate de o in ANSi C, instructiunile vin dupa declaratii (nu se pot amesteca) in C++ si C99, se pot intercala oricum Programarea calculatoarelor Curs 1 Marius Minea introducere #include int main(void) int x; x = 5; printf("Numarul x are valoarea: "); printf("%d", x) ; return 0; Pentru a tipari valoarea unei expresii, printf ia doua argumente: - un sir de caractere (specificator de format): %c (caracter), %d (intreg), %f (float), %s (sir), etc - expresia, al carei tip trebuie sa fie compatibil cu cel indicat (verificarea cade in sarcina programatorului !!!) Programarea calculatoarelor Curs 1 Marius Minea introducere 14 #include int main(void) int x; scanf("%d", &x) ; printf("%d", x) ; return 0; } - scanf: functie de citire formatata, perechea lui printf - primul argument (sirul de format) la fel ca la printf - deosebirea: inainte de numele variabilei apare operatorul & (adresa) in C, parametrii se pot transmite primind lui x (prin valoare!), scanf stie unde sa puna valoarea Citirea unui caracter: cu functia getcharO char c;    mai bine: int, discutam mai tarziu c = getchar(); Programarea calculatoarelor Curs 1 Marius Minea introducere #include int main(void) int a, b, sum; printf("introduceti un numar: "); scanf("%d", &a);  * numarul se citeste in variabila a *  printf("introduceti alt numar: "); scanf("%d", &b); sum = a + b; printf("Suma este %d n", sum); return 0; } Programarea calculatoarelor Curs 1 Marius Minea introducere 16 introducere introducere in Pascal, read writedn) ia oricate argumente, de orice tip; compilatorul trateaza detaliile de formatare specifice fiecarui tip in C, printf scanf iau tot un numar arbitrar de argumente: - primul este un sir de caractere (care indica formatul) - restul: expresii (printf) sau adrese (scanf) cu tipuri corespunzatoare celor indicate in sirul de format int x, y; scanf ("%d%d", &x, &y); printf ("Suma lui %d si %d este %d n", x, y, x + y); Programarea calculatoarelor Curs 1 Marius Minea #include int main(void) int x; printf("introduceti un numar: "); scanf("%d", &x); if (x , = intrebare: ce face fragmentul urmator pentru x = -1, у = -2 ? if (x > 0) if (y > 0) printf("unu"); else printf("doi"); Raspuns: else apartine de cel mai apropiat if (precedent) Programarea calculatoarelor Curs 1 Marius Minea introducere 19 introducere 20 introducere #include int main(void) char c; int words = 0; c = getcharO ;  * citeste un caracter de la intrare *  while (c == ’ ’) c = getcharO;  * spatii la inceput +  while (c != ’ n’) { words = words + 1; while (c != ’ ’ && c != ’ n’) c = getcharO;  * cuvant +  while (c == ’ O c = getcharO;  * spatii *  } printf("%d cuvinte n", words); return 0; } Programarea calculatoarelor Curs 1 Marius Minea Multe programe "interesante'' au cicluri (sau recursivitate) Trebuie: - sa proiectam programul asa incat - sa fim siguri ca la iesirea clin ciclu da rezultatul dorit Cum ? Nu prin incercari, ci rationand dupa o anumita schema: - ce stim la inceputul ciclului ? - ce stim dupa fiecare iteratie ? se pastreaza o anumita proprietate ? - ce dorim sa deducem la sfarsit ? => cautam un (proprietate) adevarat(a) la fiecare iteratie Fie programul while ( E ) do S; Vrem sa demonstram ca dupa terminare e adevarata proprietatea Q Cautam un i cu urmatoarele proprietati: - i e adevarat inainte de a incepe ciclul while - daca i si E sunt adevarate (se intra in ciclu), dupa executia corpului S, e din nou adevarat i - daca i e adevarat si E e fals (ciclul s-a terminat), putem deduce Q Programarea calculatoarelor Curs 1 Marius Minea #include int main(void) int m, lo = 0, hi = 1023; printf("Ganditi-va la un numar intreg intre 0 si "); printf("%d n", hi); do {    invariant: lo m, deci N >= m + 1, deci facem lo = m + 1; + daca nu, atunci N lo = N = hi printf("Numarul este %d ! n", lo); return 0; } Programarea calculatoarelor Curs 1 Marius Minea introducere 22 introducere 23 sirul lui Fibonacci: Fq = F± = l,Fn = Fn i + Fn 2 (n > 2) #include int fib(int n) { if (n int main(void) int n, f, f1, f2; printf("introduceti numarul n: "); scanf("%d", &n); printf("Fibonacci(%d) = ", n); f = 1; fl = 1;    f = fib(k); fl = fib(k-l); cu к = 1 n = n - 1; while (n > 0) {    invariant: k+n = N (val data pt n) f2 = fl;    f2 = fib(k-l) fl = f;    fl = fib(k) f = fl + f2;    f = fib(k+l), deci к creste cu 1 n = n - 1;    n scade cu 1 } printf("%d n", f); return 0; } Programarea calculatoarelor Curs 1 Marius Minea introducere introducere Marius Minea 5 octombrie 2004 - familiaritate cu sisteme PC, lucru cu fisiere, medii de programare -in principal la laborator - de la exemple la programe pentru situatii reale - programarea = dezvoltarea unui produs software, de la A la Z - buna cunoastere a unui limbaj de programare si un punct de plecare pentru altele - principii si stil de programare Utilizarea si programarea calculatoarelor Curs 1 3 introducere Marius Minea - program executabil: cod masina interpretabil direct de calculator - program sursa: in limbaj inteligibil de programatorul uman din format sursa in format executabil: - compilare-, anterior rularii programului (pt С, C++, PASCAL) - interpretare’, direct la rulare: (pt variante de BASiC, LiSP) in mod tipic, un program generic: - citeste - efectueaza (calcule) asupra lor - produce niste la iesire de prelucrare (CPU) - unitate de control - unitati aritmetice si logice pentru calcul primara: circuite integrate secundara: medii magnetice (disc fix, floppy), optice (CD) (dispozitive de intrare iesire) tastatura, mouse, ecran, imprimanta, Joystick Utilizarea si programarea calculatoarelor Curs 1 Marius Minea Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 5 introducere John von Neumann (1945) - propune arhitectura mentionata (control, UAL, memorie, i O) - si conceptul de (deosebirea esentiala, de ex fata de calculatorul de buzunar, actionat direct de utilizator) Acestea stau la baza tuturor calculatoarelor conventionale Functionarea: 1 citeste instructiunea de la adresa din numaratorul de program 2 inainteaza numaratorul de program la urmatoarea instructiune 3 unitatea de control decodifica instructiunea si comanda operatia (care poate modifica registri, memoria, numaratorul de program) 4 se reia ciclul de la punctul 1 - unui sistem de calcul (timpul de procesare al unitatii centrale, memoria, perifericele, sistemul de fisiere) - creeaza o interfata - ofera utilizate din limbaje de programare (alocare de memorie, citire, tiparire) Vom programa: sub Windows in semestrul i, sub Linux in semestrul ii Urmarim: scrierea de programe , independent de sistemul de operare si mediul de programare folosit Utilizarea si programarea calculatoarelor Curs 1 Marius Minea Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere introducere - Definirea si analiza specificatiilor - Proiectare - implementare (Codare) laboratorul si examenul evalueaza rezultatele (nu colectiv!) -60% examen 1 2 partial (30%), 1 2 final (30%) -40% activitate pe parcurs (30% laborator, 10% seminar) Consultatii: la birou (B 531) - o ora fixa pe saptamana (libera in orar): Joi 8-10 ? - sau stabiliti o alta ora prin   (mariusScs utt ro) Pagina de curs: la http:  www cs utt ro  marius curs upc Utilizarea si programarea calculatoarelor Curs 1 Marius Minea - consultati cadrele didactice in caz de nelamuriri - invatati impreuna - prezentati solutiile altora (modificate sau nu) ca ale voastre (nu numai la acest curs): o (carti, articole, pagini de web, idei ale altora) Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 13 introducere 14 = secventa de pasi pentru rezolvarea unei probleme : reprezentarea grafica a unui algoritm - fara particularitatile unui anumit limbaj de programare, dar precis Blocuri (instructiuni) componente in scheme logice: start, stop, atribuire, citire, scriere, decizie (START) ( STOP) | vart-expr | schema logica: graf format din cele 6 tipuri de instructiuni, cu un singur nod de START si unul singur de STOP Utilizarea si programarea calculatoarelor Curs 1 Marius Minea - dezvoltat si implementat in 1972 la АТ&Т Bell Laboratories de Dennis RitChie http:  cin bell-labs coin cm cs who dmr chist html - limbaj de (blocuri, cicluri, functii) (concept aparut in ALGOL 60, apoi ALGOL 68, PASCAL, ) - necesitatea unui limbaj pentru (legatura stransa cu dezvoltat la Bell Labs) - C dezvoltat initial sub UNiX; in 1973, UNiX rescris in totalitate in C - cartea de referinta: Brian Kernighan, Dennis Ritchie: (1978) -in 1988 (vezi K&R editia ii) limbajul a fost standardizat de ANSi (American National Standards institute) - dezvoltari ulterioare: C99 (standard iSO 9899) Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 15 introducere - limbaj de nivel : ofera tipuri, operatii, instructiuni simple fara facilitatile complexe ale limbajelor de nivel (foarte) inalt (nu: tipuri multime, concatenare de siruri, etc ) - limbaj de programare (functii, blocuri) - permite programarea , apropiat de hardware acces la reprezentarea binara a datelor mare libertate in lucrul cu memoria foarte folosit in programarea de sistem, interfata cu hardware - produce un cod (compact in dimensiune, rapid la rulare) apropiat de eficienta limbajului de asamblare datorita caracteristicilor limbajului, si maturitatii compilatoarelor - ->• necesita mare atentie in programare conversii implicite si explicite intre tipuri, char e tip intreg, etc void main(void) { } - cel mai mic program: nu face nimic i - pornind de la el, scriem orice program, adaugand cod intre { si } - orice program contine functia si e executat prin apelarea ei (programul poate contine si alte functii) -in acest caz: functia nu returneaza nimic (primul ), si nu are parametri (al doilea ) Vom discuta: main poate lua si argumente, si returna un int Utilizarea si programarea calculatoarelor Curs 1 Marius Minea Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere introducere 18  * Acesta este un comentariu *  void main(void)    comentariu pana la capat de linie {  * Acesta e un comentariu pe mai multe linii obisnuit, aici vine codul programului *  } - programele pot contine , inscrise intre  * si *  sau incepand cu    si terminandu-se la capatul liniei (ca in C++) - orice continut intre aceste caractere nu are nici un efect asupra generarii codului si executiei programului - programele comentate - pentru ca un cititor sa le inteleaga (altii, sau noi, mai tarziu) - ca documentatie si specificatie: functionalitate, restrictii, etc Utilizarea si programarea calculatoarelor Curs 1 Marius Minea #include void main(void) { printf("hello, world! n");  * tipareste un text *  } - prima linie: obligatorie pentru orice program care citeste sau scrie = o , include fisierul stdio h care contine declaratiile functiilor standard de intrare iesire - adica informatiile (nume, parametri) necesare compilatorului pt a le folosi corect -printf ("print formatted"): o functie standard implementata intr-o biblioteca care e inclusa (linkeditata) la compilare - N B : printf nu este o instructiune sau cuvant cheie - e apelata aici cu un parametru sir de caractere - sirurile de caractere: incluse intre ghilimele duble " -  n este notatia pentru caracterul de linie noua Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 19 introducere void main(void) { int sum;  * declaram o variabila intreaga *  int a, b;  * declaram inca doua variabile intregi *  a = 2; b = 3; sum = a + b;  * semnul de atribuire in C este = *  } - pentru a memora data si calcula, avem nevoie de o variabila are un , un si o - o variabila trebuie (cu tipul ei) inainte de folosire - cateva tipuri standard: caracter char, intreg int, real float - corpul unei functii formeaza un , intre { si } - blocul poate contine si o de instructiuni Utilizarea si programarea calculatoarelor Curs 1 Marius Minea #include void main(void) { int x; x = 5; printf("Numarul x are valoarea: "); printf ("7sd" , x) ; } Pentru a tipari valoarea unei expresii, printf ia doua argumente: - un sir de caractere ( ): %c (caracter), %d (intreg), %s (sir), etc - expresia, al carei tip trebuie sa fie compatibil cu cel indicat (verificarea cade in sarcina programatorului ii!) Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere introducere 22 #include void main(void) { int x; scanf ("7 d", &x); printf ("7 d" , x) ; } - scanf: functie de citire formatata, perechea lui printf - primul argument (sirul de format) la fel ca la printf - deosebirea: inainte de numele variabilei apare operatorul &i (adresa) transmitand explicit lui x, scanf stie unde sa puna valoarea Utilizarea si programarea calculatoarelor Curs 1 Marius Minea #include void main(void) int a, b, sum; printf("introduceti un numar: "); scanf("%d", &a);  * numarul se citeste in variabila a *  printf("introduceti alt numar: "); scanf("%d", &b); sum = a + b; printf("Suma este 7#d n", sum); Obs :  n este caracterul de linie noua Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 23 introducere 24 #include void main(void) int x; printf("introduceti un numar: "); scanf("%d", &x); if (x , = Utilizarea si programarea calculatoarelor Curs 1 Marius Minea Marius Minea Metode formale introducere 5 OCt 2004 Functionarea corecta a sistemelor importanta si dificultate Ce sunt metodele formale ? Domenii si exemple de aplicatie Modelare si specificare - urmarirea corectitudinii sistemelor proiectate - cunoasterea principalelor tipuri si surse de erori - cunoasterea metodelor formale ca alternativa la simulare si testare - obisnuinta cu rigoarea in descrierea sistemelor - construirea de modele corespunzatoare pentru sistemele proiectate - exprimarea neambigua a specificatiilor (proprietatilor dorite) - evaluarea aplicabilitatii metodelor formale (manuale sau automate) - cunoasterea unor utilitare de verificare Verificare formala Curs 1 Verificare formala Curs 1 Marius Minea Metode formale introducere 3 Metode formale introducere - aparat medical pentru terapie cu radiatie - 6 accidente cu morti si rani grave (1985-87, SUA, Canada) - cauza directa: erori in programul de control [Leveson 1995]: incredere excesiva in software (in analiza produsului) lipsa masurilor de siguranta hardware lipsa practicilor de (proiectare defensiva, specificare, documentatie, simplitate, analiza formala, testare) Verificare formala Curs 1 Marius Minea - Autodistrugere dupa o defectiune la 40 s de la lansare (1996) - Cauza: conversia 64-bit float -" 16-bit int genereaza o exceptie de depasire netratata in programul ADA - Cost: 500 milioane dolari (racheta), 7 miliarde dolari (proiectul) • principala cauza: • cod preluat de la Ariane 4, fara reanalizare corespunzatoare: - executia nu mai era necesara in timpul erorii - analiza absentei depasirii pentru variabilele neprotejate • proiectarea gresita a : sistemul de referinta inertial si cel de rezerva scoase din functiune de aceeasi eroare Verificare formala Curs 1 Marius Minea Metode formale introducere 5 Metode formale introducere Eroare in unitatea de Tmpatire cu virgula mobila, 1994 algoritm de impartire cu refacere, in baza 4 determina urmatoarea cifra din cat dintr-un tabel cateva intrari marcate gresit ca "don’t care" cost: cca 500 milioane dolari Circuitul putea fi verificat formal - demonstrare automata de teoreme [Clarke, German &i Zhao] - cu structuri speciale de date pentru reprezentarea inmultirii  impartirii [Bryant Chen] dar accentul a fost pus pe componente mai complexe (unitatea de executie, coerenta memoriei cache) Verificare formala Curs 1 Marius Minea , 1997 • ajunsa pe Marte, proba spatiala se reseta frecvent • cauza: intre procese cu resurse comune • fenomenul si solutia: cunoscute in literatura de specialitate i [Sha, Rajkumar, Lehoczky Priorlty inherltance Protocols, 1990] 1 procesul A de prioritate mica obtine resursa R 2 A intrerupt de C (prioritate mare) 3 C asteapta eliberarea lui R; A revine in executie 4 A intrerupt de В (prioritate medie, A C asteapta dupa B, fara a fi direct conditionat de В i Solutia: ridicarea prioritatii unui proces care obtine o resursa (A) la nivelul celui mai prioritar proces care poate solicita resursa (C) Verificare formala Curs 1 Marius Minea Metode formale introducere Metode formale introducere , 1998 dezintegrare la intrarea in atmosfera eroarea tehnica: discrepanta intre unitati de masura in sistemele anglo-american si metric erori multiple de proces: , 1998 trenul de aterizare e activat prematur la intrarea in atmosfera socul e interpretat ca aterizare, motoarele sunt oprite eroarea: Verificare formala Curs 1 Marius Minea direct pe produs => teste concludente erorile detectate tarziu sunt costisitoare diagnosticul necesita observabilitate completa efectuata deja in faza de proiectare simulatorul poate fi mai lent decat sistemul real Testarea sau simularea exhaustiva e adeseori imposibila (E W Dijkstra, 1979) Verificare formala Curs 1 Marius Minea Metode formale introducere Metode formale introducere " limbaje, tehnici si unelte matematice pentru specificarea si verificarea sistemelor" [Clarke &i Wing, 1996] Sau, mai in detaliu: "un set de unelte si notatii, - cu o semantica formala, - folosite pentru a specifica neambiguu cerintele unui sistem, - care admite demonstrarea de proprietati ale acelei specificatii - si demonstrarea corectitudinii unei implementari in raport cu acea specificatie" [Hinchey &i Bowen, Applications of Formal Methods, 1995] • Nu exista garantii absolute • O metoda formala nu poate fi mai buna decat modelul si specificatiile care sunt folosite - modelul si specificatiile trebuiesc validate Dar pot oferi: • o procedura logic consistenta de rationament • o acoperire exhaustiva, adeseori imposibila altfel • mecanizare si automatizare => performanta si corectitudine Pot cu succes simularea, testarea, etc Verificare formala Curs 1 Marius Minea Verificare formala Curs 1 Metode formale introducere 11 Metode formale introducere Utilitate indeosebi pentru: - : tehnici de abstractie   aproximare - : foarte greu de reprodus si analizat altfel - : (avionica, bancar, medical, securitate) Dinamica erorilor in software [dupa John Rushby, SRi] 20-50 erori kloc inainte de testare, 2-4 dupa examinarea formala a codului poate reduce erorile inainte de testare de cca 10 ori Studiu de caz pe lOkloc timp real, distribuit: verificare si validare: 52% cost (57% timp) din acesta, 27% costin examinare, 73% in testare 21% pt 4 defecte in testarea finala, din care 1 de proiectare eliminarea erorilor la examinari detaliate ale codului: decat la testare Marius Minea [dupa NASA JPL (sondele Voyager, Gallleo)] • majoritatea: deficiente in specificarea cerintelor si a interfetelor • 1 eroare la 3 pagini de cerinte si 21 pagini de cod • doar 3 din 197 erau erori de programare • 2 3 din erorile functionale: omisiuni in specificarea cerintelor • majoritatea erorilor de interfata: datorate proastei comunicari [dupa Kurt Keutzer, UC Berkeley] • > 50% din proiecte au erori dupa prima fabricare • erorile pe linie de cod hardware trebuie reduse in ritmul cresterii numarului de tranzistori pe chip • practic zero erori la nivelele inferioare de implementare • problemele sunt in proiectarea la nivel inalt (hazarduri in pipeline, executie nesecventiala, procesoare superscalare, coerenta memoriilor cache, protocoale complexe, etc ) Verificare formala Curs 1 Marius Minea Metode formale introducere Metode formale introducere Cauzele cele mai frecvente de erori: din conceptie, defecte simultane, interactiuni neprevazute - lipsurile principale: in aplicarea timpurie a metodelor formale - costul principal: eliminarea tarzie a erorilor Potentialul maxim al metodelor formale: - in modelarea si verificarea la nivel inalt - pentru sisteme complexe, concurente, distribuite, reactive, in timp real, tolerante la eroare, etc • Analiza cerintelor - identifica contradictii, ambiguitati, omisiuni • Proiectare - descompunerea in componente si specificarea interfetelor - proiectarea prin rafinare succesiva • Verificare • Testare si depanare - generarea directionata de cazuri de test • Analiza - model abstract, mai putin complex decat sistemul real Verificare formala Curs 1 Marius Minea Verificare formala Curs 1 Metode formale introducere 15 Metode formale introducere Verificarea echivalentei combinatoriale - este deja standard in utilitarele CAD Verificarea circuitelor secventiale - marile companii au colective speciale (iBM, intel, Motorola, Fujitsu, Siemens, etc ) - folosesc verificatoarele disponibile public sau cele proprii protocoalele de coerenta cache Gigamax si Futurebus+ Motorola 68020: modelat in demonstratorul Boyer-Moore, verificarea codul binar produs de compilatoare AAMP-5 (procesor pentru avionica): modelat in PVS, verificarea microcodului pentru instructiuni procesoare cu pipelining   superscalare tip DLX - analiza codului ADA cu anotatii in limbajul SPARK - software "corect prin constructie", cost redus (Traffic Collision Avoidance System) • instalat obligatoriu pe avioanele comerciale din S U A • alerta si deviere automata in cazul apropierii periculoase • specificatia redactata intr-un limbaj formal (RSML) • s-a verificat completitudinea si consistenta [Heimdahl, Leveson ’96] • s-a abandonat incercarea de a specifica in engleza - Modele formale pentru sisteme complexe sunt fezabile - Pot fi analizate de expertii din domeniul de aplicatie Verificare formala Curs 1 Marius Minea Verificare formala Curs 1 Marius Minea Metode formale introducere Metode formale introducere 18 Telefonie Specificarea si analiza interactiilor intre diversele caracteristici ale sistemului telefonic Sisteme electronice de consum Verificarea manuala, apoi automata a protocolului de control din componentele audio Philips, Sisteme de control in electronica auto Protocoale de comunicatie Protocoale de securitate Analiza folosind logici speciale pentru a rationa despre mesaje criptate, intrusi, etc Software de sistem Verificarea driverelor de periferice • Specificarea: necesara in orice metoda formala (poate fi unicul aspect) • necesita limbaj cu si definita formal (matematic) Limbajul de specificare defineste: - un domeniu sintactic (notatia) - un domeniu semantic (universul de obiecte considerat) - o definitie precisa a obiectelor care satisfac o specificatie [M Chechlk, Automated Verification, curs, U Toronto] Verificare formala Curs 1 Marius Minea Verificare formala Curs 1 Marius Minea Metode formale introducere Metode formale introducere - un alfabet de simboluri (ex propozitii, operatori logici) - reguli gramaticale pentru formarea unor formule bine definite Domeniul semantic variaza de la limbaj al limbaj: - secvente de stari, secvente de evenimente, structuri de sincronizare (in limbajele de specificare a sistemelor concurente) - functii intrare -" iesire, relatii, computatii, transformatoare de predicate (in cazul limbajelor de programare) Verificare formala Curs 1 Marius Minea (nu trebuie sa reprezinte o functie calculabila) (ex limbajele de programare) (orientate pe proprietati) (ex functionalitate, reactivitate) - descriu comportamentul sistemelor in raport cu proprietatile ce trebuie satisfacute (orientate pe modele) (ex diagrame, conexiuni, ierarhie) - construiesc un model al sistemului folosind notiuni matematice precise (multimi, functii, logica predicatelor) Uneori: acelasi limbaj pentru specificatie si model (sau implementare) => e posibila rafinarea pe nivele succesive de abstractie Verificare formala Curs 1 Marius Minea Metode formale introducere 21 Metode formale introducere neambigua: un inteles bine definit (NU: limbaj fara semantica formala, limbaj natural, scheme grafice cu mai multe interpretari) consistenta (necontradictorie) - exista cel putin un obiect care o satisface poate fi incompleta - comportament la latitudinea implementarii sau nondeterminism Daca limbajul are un sistem de inferenta logica se pot demonstra proprietati pornind de la o specificatie - bazat pe logica de ordinul i si teoria multimilor - descriere functionala, declarativa - folosit extensiv la proiecte industriale in Marea Britanie PhoneDB members : P Per son telephones : Per son Phone dom phones C members - o schema (PhoneDB) (stari - operatii care schimba starea FindPhones = PhoneDB пате? : Person numbersl : PPhone пате? € dom phones numbers = p&ones(|{name?}|) evtl tranzitii), si un invariant (A) sau nu (H) Verificare formala Curs 1 Marius Minea Verificare formala Curs 1 Marius Minea Metode formale introducere 23 Metode formale introducere [Guttag, Hornig, Garlan, МГТ DEC SRC] 1 abstractie (specificare) independenta de limbaj 2 specificare de interfata pentru module intr-un anumit limbaj Table: trait includes integer introduces new: -> Tab add: Tab, ind, Val -> Tab lookup: Tab, ind -> Val asserts  forali i, il: ind, v: Val, t: Tab  not (i  in new); i  in add (t, il, v) == i = il V 1  in t lookup(add(t, 1, v), 11) == if i = 11 then v else lookup(t, 11) Verificare formala Curs 1 Marius Minea Specificare de interfata pentru limbajul C: mutable type table uses Table(table for Tab, char for ind, char for Val, int for int); constant int maxTabsize; table table create(void) { ensures result’ = new    fresh(result); char table read(table t, char i) requires 1  in t ; ensures result = lookup(t", i); - defineste preconditii si postconditii - interfata ramane la nivelul abstract (fara algoritmi) Verificare formala Curs 1 Marius Minea Metode formale introducere Metode formale introducere - origineaza din eforturile grupului iBM Viena in anii '70 - similara si inrudita cu Z - dezvoltata de Jean-Raymond Abrial - spre deosebire de Z, are si suport automatizat puternic - preconditii   postconditii, invarianti, rafinament - suport pentru generarea automata de cod - utilizare industriala (metroul din Paris, Alsthom, n   lOkloc) Notiuni de specificare de interfata incorporate direct in limbaje, de ex Eiffel (design by contract) Verificare formala Curs 1 Marius Minea Doua directii de abordare: - programare imperativa + adaugiri (semafoare, monitoare, rendezvous, etc ) - model de calcul concurent, bazat pe interactiunea proceselor ("interactiune indivizibila") Comunicarea si concurenta sunt notiuni complementare [Milner] • Communicating Sequential Processes [Hoare] • Calculus of Communicating Systems [Milner] Verificare formala Curs 1 Marius Minea Metode formale introducere 27 Metode formale introducere Exemplu [Hoare]: automat pentru ciocolata, cu monede Alfabetul: сц,г = {inlp, in2p, smalt, large, outlp} Comportamentul: V = (in2p —? {large —? V small —? outlp —? V) mlp —> small —> V) sau, formal: V = pX (in2p —" (large —> X small —> outlp —> X) inlp —> small —> X) (unica solutie a ecuatiei de mai sus) CSP: formalism (algebra a proceselor) axat pe actiuni, cu nondeterminism, compozitie sincrona, etc • Variante: - etichete pe stari sau pe tranzitii - tranzitii specificate ca functii sau relatii - augmentat sau nu cu variabile (date) • Structura Kripke: = automat etichetat cu propozitii atomice dintr-o multime AP: M = (S, So, R L) - S: multime finita de stari - Sq: multimea starilor initiale - R C S x S: relatie de tranzitie totala - L : S -" 2ap: functie de etichetare a starilor Verificare formala Curs 1 Marius Minea Verificare formala Curs 1 Marius Minea Metode formale introducere 29 Metode formale introducere in general: sistemul (specificatie) Comportament corect - sistemul privit ca realizand o functie intrare -" iesire - exemplu de formalism: tripletele lui Hoare {'"} S {Q} { preconditie } program(sistem) { postconditie } Exemplu de rationament: {P} Sj {Qi} Qi => Q2 {Q2} S2 { ?,} {'"} Si;S2 { ?,} Comportament corect • pentru sisteme reactive: executie (conceptual) infinita • comportamentul definit ca reactie la o secventa de intrare • specificare: de ex logica temporala • proprietati: absenta blocajului, reactie in timp limitat, etc Exemple: - orice cerere este urmata de un raspuns in cel mult 5 secunde - orice proces obtine resursa de un numar infinit de ori - pe orice traiectorie, se ajunge la un moment dat in starea stabila Verificare formala Curs 1 Marius Minea Verificare formala Curs 1 Marius Minea Metode formale introducere 31 Doua mari categorii: - specificarea de regula in logica temporala - algoritmi de explorare exhaustiva verifica valoarea de adevar sau produc o secventa de executie ca si contraexemplu - verificarea echivalentei: specificarea e la randul ei un model - reprezentare intr-un sistem logic cu axiome si reguli de deductie - domeniul analizat reprezentat si el printr-un grup de axiome si reguli (o teorie) - demonstrare mecanizata: ghidata manual sau automata Verificare formala Curs 1 Marius Minea Analiza programelor introducere 27 aprilie 2004 Ce este analiza programelor Aplicatii practice recente Analiza fluxului de date: introducere istoric: - (sub)domeniu legat de : in special pentru optimizare - mai recent: in ; pentru Scopul: - pentru a deduce proprietati despre comportamentul programelor (in principal corectitudinea, dar si performanta, etc ) Metode: - prin analiza statica a codului sursa (NU executabilul; NU rularea lui) => metoda diferita de simulare sau testare Analiza programelor Curs 1 Marius Minea Analiza programelor Curs 1 Marius Minea Analiza programelor introducere 3 Analiza programelor introducere Analiza programelor e legata tot mai mult de verificarea formala Verificarea formala: stabileste ca un sistem e corect prin analiza riguroasa a unui model matematic al sistemului -in general, proprietati specifice, detaliate despre comportament (ex dupa evenimentul A apare evenimentul В etc ) - necesita in principiu analiza (simbolica) a secventelor de executie a modelului (explorarea spatiului starilor) Analiza statica: bazata tot pe tehnici matematice, riguroase - de regula pentru proprietati mai generale - folosind aproximatii sigure (conservatoare) - de regula nu exploreaza spatiul starilor programului Analiza programelor: tehnici pentru prezicerea statica, la compilare a multimii comportamentelor dinamice (la rulare) ale programului [Nielson & Nielson] fn general, o analiza precisa e nedecidabila (v Church, Godel, Turing) => analiza trebuie sa faca aproximatii => dar trebuie sa fie sigura (sa corespunda semanticii programului, si sa nu omita situatii posibile   erori Din punct de vedere practic: - suficient de precisa (cu minim de avertismente false) - eficienta (spatiu timp) pentru a trata programe de dimensiuni realiste Analiza programelor Curs 1 Marius Minea Analiza programelor Curs 1 Marius Minea Analiza programelor introducere 5 Analiza programelor introducere [ Patrick Cousot et al 2003 (Ecole Normale Superieure) ] Contextul: programe C fara alocare dinamica si recursivitate ex pentru software de sisteme integrate (embedded) caz specific: software-ul de control de zbor din Airbus A340 Date: 132 000 linii sursa, 2 ani de cercetare si analiza, lh20’ executie Tipuri de erori la rulare tratate: - comportament nedefinit conform standardului (impartire la zero, depasire de indici de tablou); - comportament dependent de implementare (ex depasire aritmetica), - nerespectarea asertiunilor programatorului: assertO si similare typedef enum {FALSE = 0, TRUE = 1} BOOLEAN; BOOLEAN B; void main O { unsigned int X, Y; while (1) {  * *  В = (X == 0);  * *  if (!B) { Y = 1   X;  * *  }•  * sursa: Cousot et al *  E usor de detectat vizual corelarea intre в si x dar intr-un program mare, complexitatea analizei creste exponential Analiza programelor Curs 1 Marius Minea Analiza programelor Curs 1 Marius Minea Analiza programelor introducere Analiza programelor introducere BOOLEAN init; float P, X; void filter () •  static float EL2], S ; if (iNiT) SCO] = P = ECO] = X; else P = ((((0 5 * X - E * 0 7) + E[l] * 0 4) + SCO] * 1 5) - S[l] * 0 7); E[l] = ECO] ; E = X; S[l] = SCO] ; S = P; 1 void шаіп () •  X = 0 2 * X + 5; iNiT = TRUE; while (1) •  X = 0 9 * X + 35; filter (); iNiT = FALSE; 1 } * sursa: dupa Cousot et al *  Problema: demonstrarea absentei depasirilor, si ramanerea lui Pintr-un interval dat (in acest caz, [-1327 05, 1327 05] =-tehnici de analiza pe intervale de valori, cu specific de teoria reglarii Analiza programelor Curs 1 Marius Minea float x = І ОеЗО, у = x + 1 0e20; printf("%f n", у - x);  * tipareste 0 000000 *  double x; float y, r;  * x = idexpQ ,50)+ldexp(l ,26) ; *  x = 1125899973951488 0; y=x+l;r=y-x; printf("%f n", r);  * tipareste 67108864 000000 *  La reprezentarea a numerelor reale pot aparea erori de rotunjire Analiza trebuie sa tina cont de ele, chiar cumulate dupa ore de rulare! Analiza programelor Curs 1 Marius Minea Analiza programelor introducere Analiza programelor introducere Clase de erori frecvente in programe: - folosirea variabilelor neinitializate - dereferentierea de pointeri nuli - depasirea limitelor de indici in tablou Aceste erori pot fi detectate prin a codului sursa ex Splint (U Virginia) sau UNO (Bell Labs) pt C sau ESC Java (Compaq SRC) int *p = malloc(100 * sizeof(int)); if (p != NULL) printf ('7,d", p[100j); splint +bounds pointer c pointer c:7:18: Array element p used before definition pointer c:7:18: Possible out-of-bounds read: p Problema: analize in acelasi timp (fara multe alarme false) si la programe de dimensiuni mari Problema: ce valori poate sa ia o anumita variabila intr-un program ? Mai precis: ce expresii din program pot fi atribuite la o variabila ? Se poate calcula un graf al fluxului de valori (value flow graph) si folosi pentru a detecta eventuale atribuiri de valori eronate Daca apar pointeri, valoarea unei variabile se poate modifica indirect => care sunt toti pointerii care pot indica o anumita variabila ? => pot doi pointeri sa indice spre acelasi obiect (alias) ? - algoritm precis (tine cont de sensul atribuirii, a-i-y [Andersen ’94] cubic, impractic pentru programe mari - algoritm cu unificare (la fel pt x "- у si у "- a-) [Steensgaard ’96] aproape liniar, relativ imprecis - algoritm hibrid [Das’00], practic liniar, precizie apropiata de primul Analiza programelor Curs 1 Marius Minea Analiza programelor Curs 1 Marius Minea Analiza programelor introducere 11 Analiza programelor introducere 12 [Engler et al , Stanford ’OO] - meta-compilare - descoperit > 500 de erori in cod sistem (Linux, OpenBSD, etc ) - prin analize statice de tipul celor din compilatoare, combinate cu enuntarea de proprietati si reguli specifice domeniului de aplicatie Exemple: - intreruperile sunt reactivate inainte de intoarcerea din functie: = fiecare oii are o pereche sti pe toate caile de iesire - verificarea in nucleu a pointerilor din spatiul utilizator: = toate utilizarile se fac doar in functii care isi testeaza pointerii - maiioc free: test de pointer nul, neutilizare dupa eliberare - cu intreruperile dezactivate nu apeleaza functii care se pot bloca - utilizarea semafoarelor se face corect, cu apeluri pereche [Das, Lerner, Seigle ’02 - Microsoft + U Washington] - o analiza statica (property simulation) scalabila la n   100 kloc - exemplu: absenta de erori in > 600 apeluri de sistem pentru 15 pointeri de fisiere in codul gcc (140 kloc) - prin analiza hibrida intre o analiza standard de flux de data (imprecisa) si analiza dependenta de cale (path-sensitive, prea costisitoare) - pastrand corelarea dintre starea proprietatii analizate (ex uninit, open, ciosed pentru fisier) si variabilele relevante din program) if (dump) f = fopenfdumpFil, "w"); if (p) x = 0; else x = 1; if (dump) fGlose(f); Analiza programelor Curs 1 Marius Minea Analiza programelor Curs 1 Marius Minea Analiza programelor introducere 13 Analiza programelor introducere 14 CCured [Necula et al , UC Berkeley] Securizarea de cod C prin inserarea unui minim de verificari la rulare Problema: folosirea variata si nesigura a pointerilor in limbajul C Solutia: un sistem de tipuri care captureaza modul de folosire a fiecarui pointer din program: safe (doar dereferentiat), seq (cu indice), wild (cu typecast arbitrar) Cum: instrumentare la nivel sursa, modificand reprezentarea pointerilor (adresa de baza + tag + lungime valida pt verificari de indici) - se deduce pentru fiecare pointer tipul cel mai restrictiv - se instrumenteaza cu verificarile necesare (nenul, depasire, etc ) Rezultate: pe cod real (Apache, OpenSSL, OpenSSH, sendmail, bind), cu cca 10%-50% degradare de performanta (cu Purify: 10-100 ori!) Analiza programelor Curs 1 Marius Minea - Analiza fluxului de date principalele tehnici originare din domeniul compilatoarelor aspecte legate de dualitatea precizie   eficienta - Analiza bazata pe constrangeri cadru general pentru reprezentarea prin relatii de constrangere intre multimi, cu proceduri eficiente si generice de solutionare - interpretare abstracta simplifica programul prin definirea unei semantici care considera doar aspectele relevante pentru proprietatea dorita - Sisteme de tipuri definind sistem corespunzator de tipuri, multe proprietati pot fi convertite la probleme de inferenta   verificare a tipurilor Analiza programelor Curs 1 Marius Minea Analiza programelor introducere 15 Analiza programelor introducere Tehnici cu originea in domeniul compilatoarelor - folosite pentru generarea de cod (alocarea de registri) - si optimizarea de cod (propagarea constantelor, factorizarea expresiilor comune, detectarea variabilelor nefolosite, etc ) Ulterior, unificate intr-un cadru general care permite aplicarea si la alte probleme de analiza de cod Abordarea de baza: - construirea grafului de flux de control al programului - urmarirea modului in care proprietatile de interes se modifica pe parcursul programului (la traversarea nodurilor   muchiilor grafului) Reprezentare in care: - nodurile sunt instructiuni - muchiile indica secventierea instructiunilor (inclusiv salturi) => putem avea: noduri cu: - un singur succesor (ex atribuiri), - mai multi succesori (instructiuni de ramificatie) - mai multi predecesori (reunirea dupa ramificatie) Obs : Alternativ, dar mai putin folosit: - nodurile sunt puncte din program (valori pentru PC) - muchiile sunt instructiuni cu efectele lor Analiza programelor Curs 1 Marius Minea Analiza programelor Curs 1 Marius Minea Analiza programelor introducere Analiza programelor introducere 18 G = (N E) : graful de flux de control ( № : noduri; E : muchii) s : o instructiune de program (nod in graful de flux de control) entry, exit: punctele de intrare si de iesire din program  n(s) : multimea muchiilor care au s ca destinatie out(s) : multimea muchiilor care au s ca sursa src(e), dest (Ei : instructiunea sursa si destinatie a muchiei e pred(s) : multimea predecesorilor instructiunii s succ(s) : multimea predecesorilor instructiunii s Cu aceste notiuni scriem ce descriu cum se modifica valorile analizate (dataflow facts) de la o instructiune la alta Notam cu indicii -m si out valoarea analizata la intrarea si respectiv iesirea din instructiunea s Analiza programelor Curs 1 Marius Minea Care sunt toate atribuirile (definitiile) care pot atinge punctul curent (inainte ca valorile atribuite sa fie suprascrise) ? Elementele de interes sunt perechi: (variabila, linie de definitie) Pentru fiecare instructiune (identificata cu eticheta ei l) ne intereseaza valoarea dinainte RDjn(s) si de dupa RD0Uf(s) - nodul initial din graf nu e atins de nici o definitie: RDout(entry) = {(", ?) | v e V} - o atribuire l : v y- e sterge toate definitiile anterioare pentru variabila v (dar nu pt alte variabile) si o introduce pe cea curenta RDoutd : w "- e) = (RZ> n(s)   {(","')}) U {(", )} - definitiile de la intrarea unei instructiuni sunt reuniunea definitiilor de la iesirea instructiunilor precedente: RDjn(s') = Uyrpredic Analiza programelor Curs 1 Marius Minea Analiza programelor introducere 19 Analiza programelor introducere in fiecare punct de program, care sunt variabilele ale caror valoare va fi folosita pe cel putin una din caile posibile din acel punct ? (analiza utila in compilatoare pentru alocarea registrilor) Functia de transfer: LV)n(s) = (r'i’out(s)   wnte(s)) и read(s) (o variabila e live inainte de s daca e citita de s, sau e live dupa s fara a fi scrisa de s) => sensul analizei e inapoi Operatia de combinare (meet): ( 0 daca succ(s) = 0 LV eout(s) - J UycsuccwbV-em( ) altfel => combinarea facuta prin uniune (may, pe cel putin o cale) Calculul: algoritm de tip worklist care face modificari pornind de la valorile initiale pana nu mai apar schimbari => se atinge un Analiza programelor Curs 1 Marius Minea in fiecare punct de program, care sunt expresiile a caror valoare a fost calculata anterior, fara sa se modificat, pe toate caile spre acel punct? (daca valoarea se tine minte intr-un registru, nu trebuie recalculata) Functia de transfer: AEout(s) = (AE-ln(s)   {e | V(e) n wnte(s) 0}) U{e 6 Subezp(s) | V(e) П wnte(s) = 0} (expresiile de la intrarea in s care nu au variabile modificate de s, si orice expresii calculate in s fara a li se modifica variabilele) Operatia de combinare (meet): ( 0 daca pred(s) = 0 ,fA J   t ^pred^out^ altfel => combinarea e facuta prin intersectie (must, pe toate caile); analiza e inainte Analiza programelor Curs 1 Marius Minea Analiza programelor introducere Care sunt expresiile care trebuie evaluate pe orice cale din punctul curent inainte ca valoarea vreunei variabile din ele sa se modifice ? => evaluarea se poate muta in punctul curent, inainte de ramificatii - o analiza inapoi, si de tip universal (must) VBEjn(s) = (VBEout(s)   {e | V(e) П write(s) 0}) U Subexp(s) (A-t 0 daCS SUCCM = 0 VBEout(-} - t Плиссе)VBEin(s’) altfel Analiza programelor Curs 1 Marius Minea Programarea calculatoarelor introducere Marius Minea 26 februarie 2008 Programarea calculatoarelor Curs 1 Marius Minea - dezvoltat si implementat in 1972 la АТ&Т Bell Laboratories de DenniS Ritchie http:  cin bell-labs coin cin cs who diiir chist htinl - nevoia unui limbaj pentru scrierea de sisteme de operare si utilitare (strans legat de dezvoltat la Bell Labs) - C dezvoltat initial sub UNiX; in 1973, UNiX rescris in totalitate in C - cartea de referinta: Brian Kernighan, Dennis Ritchie: (1978) - 1988 (K&R editia ii) limbajul a tost standardizat de ANSi (American National Standards institute) - versiunea numita ANSi C - versiunea curent: C99 (standard iSO 9899) - toarte versatil: acces la reprezentarea binara a datelor, mare libertate in lucrul cu memoria, buna intertata cu hardware - limbaj matur, baza mare de cod (biblioteci pt multe scopuri) - eficient: compilatoare bune, genereaza cod compact, rapid Programarea calculatoarelor Curs 1 Marius Minea Programarea calculatoarelor introducere Programarea calculatoarelor introducere 4 Primul rol al programelor: de a efectua (matematice) in matematica, efectuam calcule cu ajutorul - diverse functii (sin, cos, etc ) - functii noi (depinzand de problema) - functiile existente si definite de noi - si le intr-o anumita ordine Toate aceste aspecte le intalnim si in programare Programarea calculatoarelor Curs 1 Marius Minea sqr zl —rZZj sqr(x') = x • x unei functii contine: - functiei: specifica functiei si parametrii acesteia Exemplu: functia de ridicare la patrat pentru intregi int sqr(int x) { return x * x; } un domeniu de valori (intregi), numele (un singur parametru, intreg) - functiei: aici, o singura (return) cu o care da valoarea functiei (pornind de la parametri) Limbajul are precise de scriere ( ): - diversele elemente scrise intr-o anumita ; - se folosesc pentru a le delimita precis: ( ) ; { } Programarea calculatoarelor Curs 1 Marius Minea Programarea calculatoarelor introducere Programarea calculatoarelor introducere Ridicarea la patrat pentru numere reale float sqrf(float x) sqrf : iR —r ]R , г  X return x * x; sqrf(x) = X • X i - o alta functie decat cea dinainte: alt domeniu de definitie si de valori - trebuie sa-i dam alt nume daca o folosim in acelasi program - strict vorbind si operatia * e alta, fiind definita pe alta multime Exista diferente importante intre tipuri numerice in C si matematica - in matematica, Ж c iR, ambele sunt infinite, Ж e densa - in C, int si float sunt tipuri finite; realii au precizie finita numerice au tip determinat de modul de scriere: 2 e un intreg, 2 0 e un real putem scrie un real in notatie stiintifica: 1 0e-3in loc de 0 001 sunt echivalente scrierile 1 0 si 1 respectiv o l si 1 - unele operatii sunt diferite pentru intregi si reali: e ii! 7   2 da valoarea 3, pe cand 7 0   2 0 da valoarea З Б -7   2 da valoarea -3, deci la fel cu - (7   2) Cuvintele int, float denota Un e o pentru aceste valori impreuna cu un permise Operatorul 9   Б este 1 -9   Б este -1 (scris 7 ) e definit doar pentru intregi 9 7 5 este 4 9   -Б este -1 9 7 -Б este 4 -9 7 5 este -4 -9   -5 este 1 -9 7 -Б este -4 semnul restului e acelasi cu semnul deimpartitului e valabila egalitatea a == a   b * b + a 7 b (ecuatia impartirii cu rest) Programarea calculatoarelor Curs 1 Marius Minea Programarea calculatoarelor Curs 1 Marius Minea Programarea calculatoarelor introducere Programarea calculatoarelor introducere - : au un inteles predefinit (nu poate fi schimPat) exemple: instructiuni (return), tipuri (int, float), etc - (de ex sqr, x) alesi de programator pentru a denumi functii, parametri, variabile, etc Un identificator e o secventa de caractere formata din litere (mari si mici), liniuta de subliniere si cifre, care nu incepe cu o cifra si nu este un cuvant cheie Exemple: x3, al2 34, exit, main, printf, int!6 t - (numerice: -2, 3 14; mai tarziu: caractere, siruri) - , cu diverse semnificatii: * e un operator ; delimiteaza sfarsitul unei instructiuni parantezele ( ) grupeaza parametrii unei functii sau o subexpresie acoladele { } grupeaza instructiuni sau declaratii etc Programarea calculatoarelor Curs 1 Marius Minea Exemplu: discriminantul ecuatiei de gradul ii: a • x2 + b • x + c = 0 float discrimffloat a, float b, float c) { return b*b-4*a*c; } intre parantezele rotunde ( ) din antetul functiei putem specifica oricati parametri, fiecare cu tipul propriu, separati prin virgula Programarea calculatoarelor Curs 1 Marius Minea Programarea calculatoarelor introducere Programarea calculatoarelor introducere Pana acum, am functii, fara sa le folosim Valoarea unei functii poate fi folosita intr-o expresie cu aceeasi sintaxa ca si in matematica: functle(para metru, parametru, • • •, parametru) Exemplu: in discriminantul dinaine, puteam scrie: return sqrf(b) - 4 * a * c; Sau putem defini: int cubefint x) { return x * sqr(x); } iMPORTANT: inainte de a folosi orice identificator (nume) in C, el trebuie sa fie (trebuie sa stim ce reprezinta) =t> Exemplele sunt corecte daca sqrf respectiv sqr sunt definite inainte de discrim, respectiv cube in program Programarea calculatoarelor Curs 1 Marius Minea int main(void) { return 0; } - cel mai mic program: nu face nimic ! - orice program contine functia si e executat prin apelarea ei (programul poate contine si alte functii) - in acest caz: functia nu are parametri ( ) void e un cuvant cheie pentru tipul vid (fara nici un element) - cf standard: main returneaza un cod intreg catre sistemul de operare (conventie: 0 pt terminare cu succes, yt 0 pt cod de eroare) Programarea calculatoarelor Curs 1 Marius Minea Programarea calculatoarelor introducere 11 Programarea calculatoarelor introducere 12  * Acesta este un comentariu *  int main(void)    comentariu pana la capat de linie {  * Acesta e un comentariu pe mai multe linii obisnuit, aici vine codul programului *  return 0; } - programele pot contine comentarii, inscrise intre  * si *  sau incepand cu    si terminandu-se la capatul liniei - orice continut intre aceste caractere nu are nici un efect asupra generarii codului si executiei programului - programele comentate - pentru ca un cititor sa le inteleaga (altii, sau noi, mai tarziu) - ca documentatie si specificatie: functionalitate, restrictii, etc - ce reprezinta parametrii functiilor, rezultatul, variabilele, ce conditii trebuie indeplinite, cum se comporta la eroare Programarea calculatoarelor Curs 1 Marius Minea #include int main(void) { printf("hello, world! n");    tipareste un text return 0; } - printf (de la "print formatted"): o functie standard (N B : printf nu este instructiune sau cuvant chele) - e apelata aici cu un parametru sir de caractere - constantele sir de caractere: incluse intre ghilimele " " -  n este notatia pentru caracterul de linie noua - prima linie e o , include fisierul stdio h cu functiilor standard de intrare   iesire - = informatiile (nume, parametri) necesare pentru folosire - (codul obiect, compilat): intr-o biblioteca din care compilatorul ia cele necesare pentru generarea programului executabil Programarea calculatoarelor Curs 1 Marius Minea Programarea calculatoarelor introducere Programarea calculatoarelor introducere #include #include int main(void) { printf("cos(0) = "); printf("%f", cos(0)); return 0; } Pentru a tipari valoarea u #include int sqr (int x) { return x * x; }  int main(void) { printf("2 ori -3 la patrat e "); printf("%d", 2 * sqr(-3)); return 0; } expresii, printf ia doua argumente: - un sir de caractere (specificator de format): 7 d (intreg, decimal'), 7 f (real, floating point) - expresia, al carei tip trePuie sa fie compatiPil cu cel indicat (verificarea cade in sarcina programatorului ii!) : instructiunile unei functii se executa una dupa alta - exceptii: instructiunea return incheie executia functiei (dupa ea nu se mai executa nimic) abs Z —r Z5 abs(x) = { -x altfel Cu cele discutate pana acum, nu putem defini aceasta functie in C Valoarea functiei nu e data de o singura expresie, ci de una din doua expresii diferite (x sau -x), in functie de o conditie (ж > 0 sau nu) =t> e necesara o facilitate de limbaj pentru a decide valoarea pe care o ia o expresie in functie de valoarea unei conditii (adevarat fals) Programarea calculatoarelor Curs 1 Marius Minea Programarea calculatoarelor Curs 1 Marius Minea Programarea calculatoarelor introducere 15 Programarea calculatoarelor introducere O in C are sintaxa: conditie ? exprl : expr2 - daca conditia e adevarata, se evalueaza doar exprl, si intreaga expresie ia valoarea acesteia - daca e falsa, se evalueaza doar expr2 si intreaga expresie ia valoarea acesteia int abs(int x) { return x >= 0 ? x : -x;    operator minus unar } Operatori de comparatie in C: == (egalitate), != (diferit), , >= iMPORTANT! Testul de egalitate in C e == si nu = simplu ii! Obs : Functia abs exist ca functie standard, declarata in stdlib h sgn : Z {—1,0,1} Chiar cu operatorul conditional nu putem transcrie functia direct in C (el permite doar decizia cu doua ramuri (adevarat fals), nu cu un numar mai mare de conditii   ramuri) =r trebuie sa descompunem calculul functiei sgn (de fapt decizia asupra valorii parametrului ж) - mai mici: principiu foarte important in rezolvarea de probleme Rescriem functia cu o singura decizie in fiecare punct: daca ж 0) -1 ) daca ж = 0 i altfel (ж > 0) 0 1 Programarea calculatoarelor Curs 1 Marius Minea Programarea calculatoarelor Curs 1 Marius Minea Programarea calculatoarelor introducere ( daca ж o) -1 ) daca ж = 0 i altfel (ж > 0) 0 1 int sgn (int x) { return x laboratorul si examenul evalueaza rezultatele (nu colectiv!) - consultati cadrele didactice in caz de nelamuriri - invatati impreuna - prezentati solutiile altora (modificate sau nu) ca ale voastre (nu numai la acest curs): o (carti, articole, pagini de web, idei ale altora) Programarea calculatoarelor Curs 1 Marius Minea - conceptul de compilator: descris prima data de Grace Hopper (1952) - 1954-1957: limbajul si compilatorul FORTRAN (John Backus, iBM) - 1958: LiSP (List Processing, John McCarthy, la МГТ) (Lots of idiotic, Silly Parantheses :)) - 1959: COBOL (Common Business Oriented Language) dezvoltat de CODASYL: Committee on Data Systems Languages - 1960: ALGOL 60: limbaj structurat, a inspirat multe altele - 1964: BASiC (John Kemeny, Tom Kurtz; la Dartmouth) - 1967: SiMULA (Ole-Johan Dahl, Kristen Nygaard): primul limbaj orientat pe obiecte ! - 1968: Edsger W Dijkstra: "GO TO Considered Harmful" - principiile programarii structurate - 1971: PASCAL (Niklaus Wirth); ulterior MODULA-2 Programarea calculatoarelor Curs 1 Marius Minea introducere 5 introducere - dezvoltat si implementat in 1972 la АТ&Т Bell Laboratories de Dennis Ritchie http:  cm bell-labs com cm cs who dmr chist html - contextul: evolutia conceptului de (ALGOL 68 -+ BCPL -+ В -+ C) - necesitatea unui limbaj pentru (legatura stransa cu dezvoltat la Bell Labs) - C dezvoltat initial sub UNiX; in 1973, UNiX rescrisin totalitate in C - cartea de referinta: Brian Kernighan, Dennis Ritchie: (1978) -in 1988 (vezi K&R editia ii) limbajul a fost standardizat de ANSi (American National Standards institute) - dezvoltari ulterioare: C99 (standard iSO 9899) - limbaj de nivel : ofera tipuri, operatii, instructiuni simple fara facilitatile complexe ale limbajelor de nivel (foarte) inalt (nu: tipuri multime, concatenare de siruri, etc ) - limbaj de programare (functii, blocuri) - permite programarea , apropiat de hardware acces la reprezentarea binara a datelor mare libertate in lucrul cu memoria foarte folosit in programarea de sistem, interfata cu hardware - produce un cod (compact in dimensiune, rapid la rulare) apropiat de eficienta limbajului de asamblare datorita caracteristicilor limbajului, si maturitatii compilatoarelor - (spre deosebire de PASCAL) conversii implicite si explicite intre tipuri, char e tip intreg, etc Programarea calculatoarelor Curs 1 Marius Minea Programarea calculatoarelor Curs 1 Marius Minea introducere introducere Pascal C Pascal C Operatori litere mari si mici: la fel declaratii in ordine: const, type, subprograme, program principal proceduri si functii integer real boolean varl, var2 : tip; nume: array [min max] of tip; diferitei! (case sensitive declaratii in orice ordine prog principal = functia main functii (pot returna si nimic) int float, doubie (precizii diferite) se foloseste int (valori o si 1) int varl, var2; tip nume [lung] ; indici de la 0 la lung - 1 instructiuni begin end ; e separator de instructiuni if conditie then instr while conditie do instr repeat instr until cond for cnt := min to max do instr nume fct := expr { У sau (* ; e terminator de instructiuni if conditie instr while conditie instr do instr while for (expJnit; exp test; exp incri instr return expr ; Comentarii  * *  Programarea calculatoarelor Curs 1 Marius Minea Programarea calculatoarelor Curs 1 Marius Minea introducere 9 introducere void main(void) { } - cel mai mic program: nu face nimic ! - pornind de la el, scriem orice program, adaugand cod intre { si } - orice program contine functia si e executat prin apelarea ei (programul poate contine si alte functii) -in acest caz: functia nu returneaza nimic (primul ), si nu are parametri (al doilea ) Vom discuta: main poate lua si argumente, si returna un int Programarea calculatoarelor Curs 1 Marius Minea  * Acesta este un comentariu *  void main(void) 11 comentariu pana la capat de linie {  * Acesta e un comentariu pe mai multe linii obisnuit, aici vine codul programului *  } - programele pot contine , inscrise intre  * si *  sau incepand cu 11 si terminandu-se la capatul liniei (ca in C++) - orice continut intre aceste caractere nu are nici un efect asupra generarii codului si executiei programului - programele comentate - pentru ca un cititor sa le inteleaga (altii, sau noi, mai tarziu) - ca documentatie si specificatie: functionalitate, restrictii, etc Programarea calculatoarelor Curs 1 Marius Minea introducere 11 introducere 12 #include void main(void) { printf("hello, world! n");  * tipareste un text *  } - prima linie: obligatorie pentru orice program care citeste sau scrie = o , include fisierul stdio h care contine declaratiile functiilor standard de intrare iesire - adica informatiile (nume, parametri) necesare compilatorului pt a le folosi corect -printf ("print formatted"): o functie standard implementata intr-o biblioteca care e inclusa (linkeditata) la compilare - N B : printf nu este o instructiune sau cuvant cheie - e apelata aici cu un parametru sir de caractere - sirurile de caractere: incluse intre ghilimele duble " -  n este notatia pentru caracterul de linie noua Programarea calculatoarelor Curs 1 Marius Minea void main(void) { int sum;  * declaram o variabila intreaga *  int a = 2, b;  * o variabila initializata, alta nu *  b = 3; sum = a + b;  * semnul de atribuire in C este = *  } - o variabila trebuie (cu tipul ei) inainte de folosire - poate fi optional la declarare - cateva tipuri standard: caracter char, intreg int, real float - corpul unei functii formeaza un , intre { si } - contine , urmate de o in ANSi C, instructiunile vin dupa declaratii (nu se pot amesteca) in C++si C99, se pot intercala oricum Programarea calculatoarelor Curs 1 Marius Minea introducere 13 introducere 14 #include void main(void) { int x; x = 5; printf("Numarul x are valoarea: "); printf("%d"> x); } Pentru a tipari valoarea unei expresii, printf ia doua argumente: - un sir de caractere (specificator de format): %c (caracter), %d (intreg), %f (float), %s (sir), etc - expresia, al carei tip trebuie sa fie compatibil cu cel indicat (verificarea cade in sarcina programatorului ii!) Programarea calculatoarelor Curs 1 Marius Minea #include void main(void) { int x; scanf("%d", &x); printf("%d"> x); } - scanf: functie de citire formatata, perechea lui printf - primul argument (sirul de format) la fel ca la printf - deosebirea: inainte de numele variabilei apare operatorul 8j (adresa) in C, parametrii se pot transmite transmitand explicit lui x, scanf stie unde sa puna valoarea Programarea calculatoarelor Curs 1 Marius Minea introducere 15 introducere 16 #include void main(void) int a, b, sum; printf("introduceti un numar: "); scanf("%d", &a);  * numarul se citeste in variabila a *  printf("introduceti alt numar: "); scanf("%d", &b); sum = a + b; printf("Suma este * "d n", sum); in Pascal, read write(in) ia oricate argumente, de orice tip; compilatorul trateaza detaliile de formatare specifice fiecarui tip in C, printf scanf iau tot un numar arbitrar de argumente: - primul este un sir de caractere (care indica formatul) - restul: expresii (printf) sau adrese (scanf) cu tipuri corespunzatoare celor indicate in sirul de format int x, y; scanf ("79d79d,?, &x, &y); printf ("Suma lui 7"d si 7"d este %d n", x, y, x + y); Programarea calculatoarelor Curs 1 Marius Minea Programarea calculatoarelor Curs 1 Marius Minea introducere 17 introducere 18 #include void main(void) { int x; printf("introduceti un numar: "); scanf("%d", &x); if (x , = intrebare: ce face fragmentul urmator pentru x = -1, у = -2 ? if (x > 0) if (y > 0) printf("unu"); else printf("doi"); Raspuns: else apartine de cel mai apropiat if (precedent) Programarea calculatoarelor Curs 1 Marius Minea Programarea calculatoarelor Curs 1 Marius Minea introducere 19 introducere 20 Exemplu: cate cuvinte sunt intr-o linie de text ? Solutie: reprezentam schematic structura textului intr-o linie: Notatii (folosite in informatica pentru a descrie ): (ceva)* = zero sau mai multe aparitii ale lui "ceva" (ceva)+= una sau mai multe aparitii ale lui "ceva" linie = (spatiu)* ((altceva)+(spatiu)*)*  n sau linie = ((spatiu)* (altceva)*)*  n unde: altceva = orice caracter in afara de spatiu si  n Putem transforma acum schema direct in program: - fiecare grup de forma (ceva)* corespunde unui ciclu while - conditia din ciclu: ce fel de caractere fac parte din "ceva" Programarea calculatoarelor Curs 1 Marius Minea #include void main(void) { char c; int words = 0; c = getcharO;  * citeste un caracter de la intrare *  while (c == ? O c = getcharO;  * spatii la inceput *  while (с != * n*) { words = words + 1; while (с != ? ? c != ? nO c = getcharO;  * cuvant *  while (c == ? O c = getcharO;  * spatii *  } printf("%d", words); printf(" cuvinte n"); Programarea calculatoarelor Curs 1 Marius Minea introducere introducere 22 Multe programe "interesante" au cicluri (sau recursivitate) Trebuie: - sa proiectam programul asa incat - sa fim siguri ca la iesirea din ciclu da rezultatul dorit Cum ? Nu prin incercari, ci rationand dupa o anumita schema: cautam un (proprietate) adevarat(a) la fiecare iteratie Fie programul while ( E ) do S; Vrem sa demonstram ca dupa terminare e adevarata proprietatea Q Cautam un i cu urmatoarele proprietati: -Te adevarat inainte de a incepe ciclul while - daca i si E sunt adevarate (se intra in ciclu), dupa executia corpului S, e din nou adevarat i - daca i e adevarat si E e fals (ciclul s-a terminat), putem deduce Q Programarea calculatoarelor Curs 1 Marius Minea #include void main(void) int m, lo = 0, hi = 1023; printf("Ganditi-va la un numar intreg intre 0 si "); printf ("%d n", hi) ; do {  * invariant: lo m, deci N >= m + 1, deci facem lo = m + 1; * daca nu, atunci N  nO;  * ignora restul pana la 'Xn* *  } while (lo lo = N = hi *  printf("Numarul este %d ! n", lo); Programarea calculatoarelor Curs 1 Marius Minea introducere 23 introducere 24 sirul lui Fibonacci: Fo = F1 = l,Fn = Fn i + F" 2 (n > 2) #include int fib(int n) { if (n void main(void) int n, f, fi, f2; printf("introduceti numarul n: "); scanf("%d", &n); printf("Fibonacci(%d) = ", n); f = 1; fl = 1; n = n - 1; while (n > 0) { f2 = fl; fl = f; f = fl + f2; n = n - 1;  * f = fib(k); fl = fib(k-l); cu к = 1 *   * invariant: k+n = N (val data pt n) *   * f2 = fib(k-l) *   * fl = fib(k) *   * f = fib(k+l), deci к creste cu 1 *   * n scade cu 1 *  printf("%d n", f); Programarea calculatoarelor Curs 1 Marius Minea introducere introducere Marius Minea 2 octombrie 2003 - familiaritate cu sisteme PC, lucru cu fisiere, medii de programare -in principal la laborator - de la exemple la programe pentru situatii reale - programarea = dezvoltarea unui produs software, de la A la Z - buna cunoastere a unui limbaj de programare si un punct de plecare pentru altele - principii si stil de programare Utilizarea si programarea calculatoarelor Curs 1 3 introducere Marius Minea = o secventa de instructiuni care comanda executia calculatorului - program executabil: cod masina interpretabil direct de calculator - program sursa: in limbaj inteligibil de programatorul uman Traducerea din format sursa in format executabil: - compilare-, anterior rularii programului - interpretare’, direct la rulare in mod tipic, un program generic: - citeste datele de intrare - efectueaza calcule prelucrari asupra lor - produce niste rezultate de iesire - unitate centrala de prelucrare (CPU) - unitate de control - unitati aritmetice si logice pentru calcul - memorie primara: circuite integrate secundara: medii magnetice (disc fix, floppy), optice (CD) - echipamente periferice (dispozitive de intrare iesire) tastatura, mouse, ecran, imprimanta, Joystick Utilizarea si programarea calculatoarelor Curs 1 Marius Minea Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 5 introducere John von Neumann (1945) - propune arhitectura mentionata (control, UAL, memorie, i O) - si conceptul de program memorat Acestea stau la baza tuturor calculatoarelor conventionale Functionarea: 1 citeste instructiunea de la adresa din numaratorul de program 2 inainteaza numaratorul de program la urmatoarea instructiune 3 unitatea de control decodifica instructiunea si comanda operatia (care poate modifica registri, memoria, numaratorul de program) 4 se reia ciclul de la punctul 1 - gestioneaza resursele unui sistem de calcul (timpul de procesare al unitatii centrale, memoria, perifericele, sistemul de fisiere) - creeaza o abstractie independenta de hardware - ofera apeluri sistem utilizate din limbaje de programare (alocare de memorie, citire, tiparire) Urmarim: scrierea de programe portabile, independent de sistemul de operare si mediul de programare folosit Utilizarea si programarea calculatoarelor Curs 1 Marius Minea Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere introducere - Definirea si analiza specificatiilor - Proiectare - implementare (Codare) cursul va evalua rezultatele fiecaruia dintre voi - consultati cadrele didactice in caz de nelamuriri - invatati impreuna - prezentati solutiile altora (modificate sau nu) ca ale voastre Principiu de baza: orice sursa folosita trebuie citata Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 13 introducere 14 = secventa finita de pasi pentru rezolvarea unei probleme : reprezentarea grafica a unui algoritm - fara particularitatile unui anumit limbaj de programare, dar precis Blocuri (instructiuni) componente in scheme logice: start, stop, atribuire, citire, scriere, decizie (START) ( STOP) | var r-expr | schema logica: graf format din cele 6 tipuri de instructiuni, cu un singur nod de START si unul singur de STOP Utilizarea si programarea calculatoarelor Curs 1 Marius Minea - dezvoltat si implementat in 1972 la АТ&Т Bell Laboratories de Dennis Ritchie - contextul: evolutia conceptului de programare structurata (atat Pascal cat si C inspirate de ALGOL 68) - necesitatea unui limbaj pentru programe de sistem (legatura stransa cu sistemul de operare UNiX dezvoltat la Bell Labs) - C dezvoltat initial sub UNiX; in 1973, UNiX rescris in totalitate in C - cartea de referinta: Brian Kernighan, Dennis Ritchie The C Programming Language (1978) -in 1988 (vezi K&R editia ii) limbajul a fost standardizat de ANSi (American National Standards institute) - dezvoltari ulterioare: C99 (standard iSO 9899) Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 15 introducere 16 - limbaj de nivel mediu ofera tipuri, operatii, instructiuni simple fara facilitatile complexe ale limbajelor de nivel (foarte) inalt - limbaj de programare structurat - permite programarea la nivel scazut, apropiat de hardware acces la reprezentarea binara a datelor mare libertate in lucrul cu memoria foarte folosit in programarea de sistem, interfata cu hardware - produce un cod eficient (compact in dimensiune, rapid la rulare) apropiat de eficienta limbajului de asamblare datorita caracteristicilor limbajului, si maturitatii compilatoarelor void main(void) { } - cel mai mic program: nu face nimic i - pornind de la el, scriem orice program, adaugand cod intre { si } - orice program contine functia main si e executat prin apelarea ei (vom vedea mai tarziu ca poate contine si alte functii) -in acest caz: functia nu returneaza nimic (primul void), hsc nu are parametri (al doilea void) Utilizarea si programarea calculatoarelor Curs 1 Marius Minea Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 17 introducere  * Acesta este un comentariu *  void main(void) {  * Acesta e un comentariu pe mai multe linii obisnuit, aici vine codul programului *  } - programele pot contine comentarii, inscrise intre  * si *  - orice continut intre aceste caractere nu are nici un efect - programele trebuie comentate - pentru ca un cititor sa le inteleaga (altii, sau noi, mai tarziu) - ca documentatie si specificatie: functionalitate, restrictii, etc Utilizarea si programarea calculatoarelor Curs 1 Marius Minea #include void main(void) { printf("Hello, world!");  * tipareste un text *  } - prima linie: obligatorie pentru orice program care citeste sau scrie (o directiva de preprocesare, include fisierul stdio h care contine declaratiile functiilor standard de intrare iesire) -printf ("print formatted"): o functie standard implementata intr-o biblioteca care e inclusa (linkeditata) la compilare - N B : printf nu este o instructiune sau cuvant cheie - e apelata aici cu un parametru sir de caractere - sirurile de caractere: incluse intre ghilimele duble " Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 19 introducere void main(void) { int sum;  * declaram o variabila intreaga *  int a, b;  * declaram inca doua variabile intregi *  a = 2; b = 3; sum = a + b;  * semnul de atribuire in C este = *  } - pentru a memora data si calcula, avem nevoie de variabile o variabila are un nume, un tip si o valoare - o variabila trebuie declarata (cu tipul ei) inainte de folosire - cateva tipuri standard: caracter char, intreg int, real float - corpul unei functii formeaza un bloc, intre { si } - blocul poate contine declaratii si o secventa de instructiuni Utilizarea si programarea calculatoarelor Curs 1 Marius Minea #include void main(void) { int x; x = 5; printf("Numarul x are valoarea: "); printf ("7sd" , x) ; } Pentru a tipari valoarea unei expresii, printf ia doua argumente: - un sir de caractere (specificator de format): %c (caracter), %d (intreg), %s (sir), etc - expresia, al carei tip trebuie sa fie compatibil cu cel indicat (verificarea cadein sarcina programatorului ii!) Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 21 introducere 22 #include void main(void) { int x; scanf ("7 d", &x); printf ("7 d" , x) ; } - scanf: functie de citire formatata, perechea lui printf - primul argument (sirul de format) la fel ca la printf - deosebirea: inainte de numele variabilei apare operatorul & (adresa) (adresa variabilei, adica locul unde va fi memorata valoarea; detalii ulterior) Utilizarea si programarea calculatoarelor Curs 1 Marius Minea #include void main(void) int a, b, sum; printf("introduceti un numar: "); scanf("%d", &a);  * numarul se citeste in variabila a *  printf("introduceti alt numar: "); scanf("%d", &b); sum = a + b; printf("Suma este 7#d n", sum); Obs :  n este caracterul de linie noua Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 23 introducere 24 #include void main(void) int x; printf("introduceti un numar: "); scanf("%d", &x); if (x , = Utilizarea si programarea calculatoarelor Curs 1 Marius Minea Marius Minea Marius Minea 24 septembrie 2012 - limbajul are regulile lui - rezolvam probleme (noi) - si in laborator dezvoltat in 1972 la de Dennis Ritchie asociat cu sistemul de operare UNiX si utilitarele acestuia (C dezvoltat initial sub UNiX, apoi UNiX a fost rescrisin C) Brian Kernighan, Dennis Ritchie: (1978) Limbaj vechi, dar in evolutie standardul ANSi C, 1989 (American National Standards institute) apoi standardul iSO 9899 (versiuni: C90, C99, ) dezvoltat in 1972 la de Dennis Ritchie asociat cu sistemul de operare UNiX si utilitarele acestuia (C dezvoltat initial sub UNiX, apoi UNiX a fost rescrisin C) Brian Kernighan, Dennis Ritchie: (1978) Limbaj vechi, dar in evolutie standardul ANSi C, 1989 (American National Standards institute) apoi standardul iSO 9899 (versiuni: C90, C99, ) : acces direct la reprezentarea binara a datelor, libertate in lucrul cu memoria, buna interfata cu hardware , baza mare de cod (biblioteci pentru multe scopuri) : compilatoare bune, genereaza cod compact, rapid : foarte usor de facut i date de intrare le prin calcule (matematice) (scrie) niste rezultate date de intrare le prin calcule (matematice) (scrie) niste rezultate in matematica, exprimam calculele prin functii predefinite (sin, cos, etc ) functii noi (pentru problema data) functiile existente si definite de noi le intr-o anumita ordine La fel folosim functiile in programare Ridicarea la patrat pentru intregi: sqr : Z Z sqr(x) = x   x tipul numele tipul si numele functiei functiei parametrului int sqr(int x) return x * x; Ridicarea la patrat pentru intregi: tipul numele tipul si numele functiei functiei parametrului sqr : Ж Ж int sqr(int x) sqr(x) = x   x { return x * x; } unei functii contine: functiei, care specifica: domeniul de valori (intregi), numele functiei (sqr) si parametrii acesteia (intregul x) functiei, cu { }: aici, o singura (return), cu o care da valoarea functiei (pornind de la parametri) Limbajul are precise de scriere ( ): elementele se scriu intr-o anumita ; se folosesc pentru a le delimita precis: ( ) ; { } Ridicarea la patrat pentru numere reale sqrf : iR iR float sqrf (float x)   return x * x; x) = x   x ’ Alt domeniu de definitie si de valori (reali) alta functie (chiar si operatia * e alta, fiind definita pe alta multime) Pentru a o deosebi in program de sqr trebuie sa-i dam alt nume Ridicarea la patrat pentru numere reale sqrf : iR iR float sqrf(float x) sqrf(x) = x   x return x * x; } Alt domeniu de definitie si de valori (reali) alta functie (chiar si operatia * e alta, fiind definita pe alta multime) Pentru a o deosebi in program de sqr trebuie sa-i dam alt nume Cuvintele int, float denota Un e o impreuna cu un permise pentru aceste valori Pentru reali, e preferabil tipul (dubla precizie) (folosit si de functiile standard: sin, cos, exp, etc ) Tipurile numerice difera intre C si matematica in matematica, ZT C iR, ambele sunt infinite, iR e densa in C, int, float, double sunt tipuri finite; realii au precizie finita numerice au tip determinat de modul de scriere: 2 e un intreg, 2 0 e un real putem scrie un real in notatie stiintifica: 1 Oe-3 in loc de 0 001 sunt echivalente scrierile 1 0 si 1 respectiv 0 1 si 1 + *   inmultirea trebuie scrisa explicit! nu putem scrie 2x, ci 2 * x (sau x * 2) Unele operatii sunt diferite pentru intregi si reali: e !!! 7   2 da valoarea 3, dar 7 0   2 0 da valoarea 3 5 -7   2 da valoarea -3, la fel cu -(7   2) + *   inmultirea trebuie scrisa explicit! nu putem scrie 2x, ci 2 * x (sau x * 2) Unele operatii sunt diferite pentru intregi si reali: e !!! 7   2 da valoarea 3, dar 7 0   2 0 da valoarea 3 5 -7   2 da valoarea -3, la fel cu -(7   2) Operatorul 9   5 = 1 -9   5 = -1 (scris 7 ) e definit doar pentru intregi 9 % 5 = 4 9   -5 = -1 9 % -5 = 4 -9 % 5 = -4 -9   -5 = 1 -9 % -5 = -4 Semnul restului e acelasi cu semnul deimpartitului Ecuatia impartirii cu rest: a = a  b*b + a% b : au un inteles predefinit (nu poate fi schimbat) Exemple: instructiuni (return), tipuri (int, float, double), etc : au un inteles predefinit (nu poate fi schimbat) Exemple: instructiuni (return), tipuri (int, float, double), etc (de ex sqr, x) alesi de programator pentru a denumi functii, parametri, variabile, etc Un identificator e o secventa de caractere formata din litere (mari si mici), liniuta de subliniere si cifre, care nu incepe cu o cifra si nu este un cuvant cheie Exemple: x3, a!2 34, exit, main, printf, int!6 t : au un inteles predefinit (nu poate fi schimbat) Exemple: instructiuni (return), tipuri (int, float, double), etc (de ex sqr, x) alesi de programator pentru a denumi functii, parametri, variabile, etc Un identificator e o secventa de caractere formata din litere (mari si mici), liniuta de subliniere si cifre, care nu incepe cu o cifra si nu este un cuvant cheie Exemple: x3, al2 34, exit, main, printf, intl6 t (intreg: -2; real: 3 14; caracter: ’a’, sir: "a") : au un inteles predefinit (nu poate fi schimbat) Exemple: instructiuni (return), tipuri (int, float, double), etc (de ex sqr, x) alesi de programator pentru a denumi functii, parametri, variabile, etc Un identificator e o secventa de caractere formata din litere (mari si mici), liniuta de subliniere si cifre, care nu incepe cu o cifra si nu este un cuvant cheie Exemple: x3, al2 34, exit, main, printf, intl6 t (intreg: -2; real: 3 14; caracter: ’a’, sir: "a") , cu diverse semnificatii: * e un operator ; delimiteaza sfarsitul unei instructiuni parantezele ( ) grupeaza parametrii functiei sau o subexpresie acoladele { } grupeaza instructiuni sau declaratii Exemplu: discriminantul ecuatiei de gradul ii: a-x2 + b- x + c = 0 float discrim(float a, float b, float c) return b*b-4*a*c; intre parantezele rotunde ( ) din antetul functiei putem specifica oricati parametri, fiecare cu tipul propriu, separati prin virgula Pana acum, am functii, fara sa le folosim Valoarea unei functii poate fi intr-o expresie Sintaxa: ca in matematica: functie(param, param,      , param) Exemplu: in discriminant, puteam folosi functia sqrf: return sqrf(b) - 4 * a * c; Pana acum, am functii, fara sa le folosim Valoarea unei functii poate fi Sintaxa: ca in matematica: intr-o expresie functie(param, param,      , param) Exemplu: in discriminant, puteam folosi functia sqrf: return sqrf(b) - 4 * a * c; Sau, folosind functia sqr dinainte putem defini: int cube(int x) return x * sqr(x); } Pana acum, am functii, fara sa le folosim Valoarea unei functii poate fi intr-o expresie Sintaxa: ca in matematica: functie(param, param,      , param Exemplu: in discriminant, puteam folosi functia sqrf: return sqrf(b) - 4 * a * c; Sau, folosind functia sqr dinainte putem defini: int cube(int x) return x * sqr(x); } iMPORTANT: inainte de a folosi orice identificator (nume) in C, el trebuie sa fie (trebuie sa stim ce reprezinta) => Exemplele sunt corecte daca sqrf respectiv sqr sunt definite inainte de discrim, respectiv cube in program int main(void) { return 0; } Cel mai mic program: nu face nimic 1 Orice program contine functia si e executat prin apelarea ei (programul poate contine si alte functii) in acest caz: functia nu are parametri ( ) void e un cuvant cheie pentru tipul vid (fara nici un element) in standard: main returneaza sistemului de operare un cod intreg (conventie: 0 pt terminare cu succes, 0 pt cod de eroare)  * Acesta este un comentariu *  int main(void)    comentariu pana la capat de linie  * Acesta e un comentariu pe mai multe linii obisnuit, aici vine codul programului *  return 0; Programele pot contine comentarii, inscrise intre  * si *  sau incepand cu    si terminandu-se la capatul liniei Orice continut intre aceste caractere nu are nici un efect asupra generarii codului si executiei programului  * Acesta este un comentariu *  int main(void)    comentariu pana la capat de linie  * Acesta e un comentariu pe mai multe linii obisnuit, aici vine codul programului *  return 0; } Programele pot contine comentarii, inscrise intre  * si *  sau incepand cu    si terminandu-se la capatul liniei Orice continut intre aceste caractere nu are nici un efect asupra generarii codului si executiei programului Programele comentate pentru ca un cititor sa le inteleaga (altii, sau noi, mai tarziu) ca documentatie si specificatie: functionalitate, restrictii, etc ce reprezinta parametrii functiilor, rezultatul, variabilele, ce conditii trebuie indeplinite, cum se comporta la eroare #include int main(void) { printf("hello, world! n");    tipareste un text return 0; printf (de la "print formatted"): o functie standard nu este instructiune sau cuvant cheie e apelata aici cu un parametru sir de caractere constantele sir de caractere: incluse intre ghilimele " "  n este notatia pentru caracterul de linie noua #include int main(void) { printf("hello, world! n");    tipareste un text return 0; printf (de la "print formatted"): o functie standard nu este instructiune sau cuvant cheie e apelata aici cu un parametru sir de caractere constantele sir de caractere: incluse intre ghilimele " "  n este notatia pentru caracterul de linie noua Prima linie e o , include fisierul stdio h cu functiilor standard de intrare   iesire = tip, nume, parametri: necesare pentru folosire (codul obiect, compilat): intr-o biblioteca din care compilatorul ia cele necesare la generarea programului executabil #include #include int main(void) printf("cos(O) = "); printf ("70f", cos(O)); return 0; #include int sqr (int x) { return x * x; int main(void) printf("2 ori -3 la patrat e " printf("7,d", 2 * sqr(-3)); return 0; Pentru a tipari valoarea unei expresii, printf ia doua argumente: - un sir de caractere (specificator de format): %d (intreg, decimal), %f (real, floating point) - expresia, al carei tip trebuie sa fie compatibil cu cel indicat (verificarea cade in sarcina programatorului ii!) : instructiunile unei functii se executa una dupa alta Exceptii: instructiunea return incheie executia functiei (dupa ea nu se mai executa nimic) abs : Z —> Z x > O altfel Cu cele invatate pana acum, nu putem defini aceasta functie in C Valoarea functiei nu e data de o singura expresie, ci de una din doua expresii diferite (x sau -x), depinzand de o conditie (x > 0) => in limbaj, trebuie sa putem valoarea luata de expresie in functie de valoarea unei (adevarat fals) in C are sintaxa: conditie ? exprl : expr2 - daca conditia e adevarata, se evalueaza doar exprl, si intreaga expresie ia valoarea acesteia - daca e falsa, se evalueaza doar expr2 si intreaga expresie ia valoarea acesteia int abs(int x) return x >= 0 ? x : -x;    operator minus unar } Operatorii de comparatie: == (egalitate), != (diferit), , >= iMPORTANT! Testul de egalitate in C e == si nu = simplu ii! Functia abs exista ca functie standard, declarata in stdlib h 1Т 1Т [ -1 X {—1, 0,1} sgn(x) = О Nu putem transcrie functia direct in C (operatorul conditional permite doar decizia cu ramuri (adevarat fals), nu cu mai multe conditii   ramuri) trebuie sa descompunem decizia asupra valorii lui x mai mici: principiu foarte im porta nt' n rezolvarea de probleme Rescriem functia cu o singura decizie in fiecare punct: daca x 0) -1 ( daca x = 0 0 ( altfel (x > 0) 1 (daca x 0) -1 ( daca x = O O [ altfel (x > 0) 1 int sgn (int x) return x y) daca x z) z daca у z) z Se repeta structura functiei min2 => putem gandi mai simplu: Rezultatul e minimul intre minimul primelor doua si al treilea, folosim direct functia dinainte pe cazuri double min3(double x, double y, double z) { return min2(min2(x, y), z);    sau min2(x, min2(y,z)) Programul dat calculeaza x6 = (x x2)2 #include int sqr(int x) { printf("Patratul lui %d e %d n", x, x*x); return x * x; int main(void) { printf("2 la a 6-a e %d n", sqr(2 * sqr(2))); return 0; in ce ordine se scrie pe ecran ? Patratul lui 2 e 4 Patratul lui 8 e 64 2 la a 6-a e 64 in C, transmiterea parametrilor la functii se face se (calculeaza valoarea) toate argumentele functiei valorile se atribuie la (numele din def fct ) apoi se incepe executia functiei cu aceste valori in C, transmiterea parametrilor la functii se face se (calculeaza valoarea) toate argumentele functiei valorile se atribuie la (numele din def fct ) apoi se incepe executia functiei cu aceste valori Programul incepe cu executia lui main, deci apelul la printf Functia printf are nevoie de valoarea argumentelor sale valoarea primului argument se stie (o ) pentru al doilea argument trebuie apelat: sqr (2 * sqr (2)) la randul lui, sqr exterior are nevoie de valoarea argumentului 2 * sqr (2), pentru care trebuie apelat intai sqr (2) ordinea apelurilor: sqr(2), apoi sqr(8), apoi printf din main Cum in C (desi ne-am putea inchipui ) Functia incepe executia fara sa aiba argumentele calculate printf ar tipari 2 la puterea 6 e , apoi ii trebuie valoarea ar apela sqr exterior care scrie Patratul lui, apoi ii trebuie x ar apela sqr (2) care scrie Patratul lui 2 e 4, returneaza 4, etc Cum in C (desi ne-am putea inchipui ) Functia incepe executia fara sa aiba argumentele calculate printf ar tipari 2 la puterea 6 e , apoi ii trebuie valoarea ar apela sqr exterior care scrie Patratul lui, apoi ii trebuie x ar apela sqr (2) care scrie Patratul lui 2 e 4, returneaza 4, etc se substituie argument pentru parametrii functiei din printf s-ar apela sqr exterior cu 2 * sqr (2) pentru (2*sqr(2))*(2*sqr(2)) s-ar apela sqr(2) de doua ori => in C, o functie calculeaza numai cu , niciodata cu Din matematica cunoastem progresie aritmetica: ( xq = b (adica: xn = b pentru n = 0) ( xn = xn i + r pentru n > 0 Exemplu: 1,4, 7,10,13, (b = 1, r = 3) Din matematica cunoastem progresie aritmetica: f x0 = b (adica: xn = b pentru n = 0) ( xn = xn i + r pentru n > 0 Exemplu: 1,4, 7,10,13, (b = 1, r = 3) progresie geometrica: f x0 = b (adica: xn = b pentru n = 0) ( xn = xn i   r pentru n > 0 Exemplu: 3, 6,12, 24,48, (b = 3, r = 2) Nu calculeaza xn direct, ci , folosind xn i Din matematica cunoastem progresie aritmetica: ( xq = b (adica: xn = b pentru n = 0) ( xn = xn i + r pentru n > 0 Exemplu: 1,4, 7,10,13, (b = 1, r = 3) progresie geometrica: ( xq = b (adica: xn = b pentru n = 0) ( xn = xn i   r pentru n > 0 Exemplu: 3, 6,12, 24,48, (b = 3, r = 2) Nu calculeaza xn direct, ci , folosind xn i O notiune e daca e : scrieti relatiile pentru: combinari C", sirul Fibonacci, Recursivitatea e fundamentala in informatica: reduce o problema la un caz mai simplu al probleme {un singur element Q sir ,—л—, un element urmat de un ООО O ex cuvant (sir de litere); numar (sir de cifre zecimale) Recursivitatea e fundamentala in informatica: reduce o problema la un caz mai simplu al probleme {un singur element Q sir ,—л—, un element urmat de un ООО O ex cuvant (sir de litere); numar (sir de cifre zecimale) : un e un pas —> drum un urmat de un pas '—> ex parcurgerea unei cai intr-un graf Recursivitatea e fundamentala in informatica: reduce o problema la un caz mai simplu al probleme {un singur element Q sir ,—л—, un element urmat de un ООО O ex cuvant (sir de litere); numar (sir de cifre zecimale) : un e un pas —> drum un urmat de un pas '—> ex parcurgerea unei cai intr-un graf O "numar (7) identificator (x) 0) #include double pwr(double x, unsigned n) { return n==0 ? 1 : x * pwr(x, n-1); int main(void) { printf("-2 la 3 = %f n", pwr(-2 0, 3)); return 0; 1 n = О x   xn 1 altfel (n > 0) #include double pwr(double x, unsigned n) { return n==0 ? 1 : x * pwr(x, n-1); } int main(void) { printf("-2 la 3 = %f n", pwr(-2 0, 3)); return 0; } Tipul reprezinta intregi fara semn (numere naturale) pwr reprezinta o a ei deci putem folosi functia in propriul corp (apelul recursiv) Chiar daca scriem pwr (-2, 3), -2 va fi (se cunoaste tipul declarat pentru fiecare parametru) Functia pwr face doua calcule: -un (n == 0 ? ?) daca da, returneaza 1 - altfel, o ; operandul drept necesita un pwr(5, 3) И125 5* pwr(5, 2) И25 5* pwr (5, 1) ;i5 5 * pwr(5, 0) 1 in calculul recursiv al functiei putere: Fiecare apel face "in cascada" , pana la cazul de baza Fiecare apel executa , dar cu (valori proprii pentru parametri) Ajunsi la cazul de baza, toate apelurile incepute sunt inca (fiecare mai are de facut inmultirea cu rezultatul apelului efectuat) Revenirea se face apelarii (apelul cu exponent 0 revine primul, apoi cel cu exponent 1, etc ) Marius Minea marius@cs upt ro http:  www cs upt ro  marius curs f i 26 septembrie 2012 Notiuni fundamentale, necesare ("cultura generala" in orice program de Computer Science) Programare: simplu, elegant, corect intr-un limbaj (ML) si stil functional Aplicatii, si cum gandim sa le rezolvam legatura cu alte discipline Functii recursive Un limbaj functional: ML functii ca obiecte fundamentale (parametri, rezultate) Structuri de date recursive: liste Un limbaj = functia e elementul de baza functiile pot fi parametri, rezultate, stocate combinand functii simple —> programe complexe Compilatorul deduce automat majoritatea din declaratii verificari stricte de tip => mai putine erori in program tipuri si functii (ex liste de orice tip) Poate fi sau (executa pe rand fragmentele de program introduse) ML are diverse variante de limbaj; folosim si sistemul http:  caml inria fr  3 + 4 ; ; - : int = 7 (* calculeaza valoarea unei expresii *) (* interpretorul afiseaza valoarea si ei *) Un de date e o multime de , impreuna cu un set de posibile pe aceste valori Tipuri de baza in ML: bool, char, float, int, string Exemplu: in ML, + e operator pe intregi, dar + e operator pentru reali let x = 3 ; ; (* declaratie *) val x : int = 3 (* raspuns: interpretorul deduce ca x e intreg *) identificatorul (variabila) x si il de expresia 3 (engl ) NU este o atribuire (x nu poate fi modificat ulterior) dar poate fi redefinit (inlocuieste vechea asociere) let f x = x + 1 ; ; (* defineste functia f de argument x *) interpretorul deduce lui f: functie de la intregi la intregi val f: int -> int = Rezultatul se obtine prin x + 1 f 4 ;; (* apelul functiei f cu argumentul 4 *) - : int = 5 let abs x = if x int -> int = add 3 4;; - : int = 7 Se definesc (si apeleaza) insiruind parametrii (fara separatori) let add x у = x + y;; val add : int -> int -> int = add 3 4;; - : int = 7 Strict vorbind, add e o functie cu parametru si returneaza (am definit o functie de ordin superior (engl higher order function) let f = add 3;; (* f у = 3 + у *) val f: int -> int = f 4; ; - : int = 7 Se definesc (si apeleaza) insiruind parametrii (fara separatori) let add x у = x + y;; val add : int -> int -> int = add 3 4;; - : int = 7 Strict vorbind, add e o functie cu parametru si returneaza (am definit o functie de ordin superior (engl higher order function) let f = add 3;; (* f у = 3 + у *) val f: int -> int = f 4; ; - : int = 7 De fapt, puteam folosi direct functia (+): (+) 3 4;; - : int = 7 let f = (+) 3; ; val f: int -> int = Functiile pot fi transmise ca parametru, returnate, si stocate (atribuite) Din matematica cunoastem progresie aritmetica: 0 (adica: xn = b pentru n = 0) pentru n > 0 , folosind xn-i Din matematica cunoastem progresie aritmetica: 0 progresie geometrica: ( xq = b (adica: xn = b pentru n = 0) ( xn = xn-i   r pentru n > 0 => nu calculeaza xn direct, ci , folosind xn i Un obiect (notiune) e recursiv(a) daca e Alte exemple: combinari C", sirul lui Fibonacci, (scrieti relatiile!) Recursivitatea e fundamentala in informatica: reduce o problema la un caz mai simplu al probleme {un singur element Q sir un element urmat de un ООО O ex cuvant (sir de litere); numar (sir de cifre zecimale) Recursivitatea e fundamentala in informatica: reduce o problema la un caz mai simplu al probleme | un singur element Q sir : un e drum : un ( un urmat de un pas —>—>—> ex parcurgerea unei cai intr-un graf Recursivitatea e fundamentala in informatica: reduce o problema la un caz mai simplu al probleme {un singur element Q sir un element urmat de un ООО O ex cuvant (sir de litere); numar (sir de cifre zecimale) f un pas —> drum : un e —>—> —> ex parcurgerea unei cai intr-un graf O : numar (7), sau identificator (x), sau expresie + expresie, sau expresie - expresie, sau ( expresie ), 1 n = О x   xn 1 altfel (n > 0) pwr X n = if n = O then 1 else x * (pwr x (n-1)) val pwr : int -> int -> int = let rec introduce o definitie (identificatorul definit, pwr poate fi in interiorul definitiei) Remarcam ca functia e definita cu baza intreaga Pentru baza reala, inmultirea e * iar cazul de baza e 1 (sau 1 0) let rec pwrf x n = if n = 0 then 1 else x * (pwrf x (n-1)) #include double pwr(double x, unsigned n) { return n==0 ? 1 : x * pwr(x, n-1); } int main(void) { printf("-2 la 3 = %f n", pwr(-2 0, 3)); return 0; } pwr reprezinta o a ei deci putem mai tarziu folosi functia in propriul corp (apelul recursiv Chiar daca scriem pwr (-2, 3), -2 va fi (se cunoaste tipul necesar pentru fiecare parametru) Functia pwr face doua calcule: -un (n == 0 ? a ajuns la ?) daca da, returneaza 1 - daca nu, o ; pt operandul drept trebuie un pwr(5, 3) И125 5* pwr(5, 2) И25 5* pwr (5, 1) ;i5 5 * pwr(5, 0) 1 in calculul recursiv al functiei putere: Fiecare apel face 7n cascada" , pana la cazul de baza Fiecare apel executa , dar cu (valori proprii pentru parametri) Ajunsi la cazul de baza, toate apelurile incepute sunt inca (fiecare mai are de facut inmultirea cu rezultatul apelului efectuat) Revenirea se face apelarii (apelul cu exponent 0 revine primul, apoi cel cu exponent 1, etc ) metoda folosita in practica pentru calcul mai rapid 1 (x2)" 2 X   (x2)" 2 n = 0 n par n impar let pwr x n = if n = 0 then 1 else let p = pwr (x * x) (n   2) in if n mod 2=0 then p else x * p sau, cu ( pe argumentul exponent): let pwr x = function i 0 -> 1 i n -> let p = pwr (x * x) (n   2) in if n mod 2=0 then p else x * p 1 ( necesita apel recursiv) = cel mai simplu caz pentru definitia (notiunea) data, definit direct termenul initial dintr-un sir recurent: xq un element, in definitia: sir = element sau sir + element E o daca lipseste cazul de baza (apel recursiv infinit!) 2 propriu-zisa - defineste notiunea, folosind un caz mai simplu al aceleiasi notiuni 3 Demonstratie de dupa numar finit de pasi (ex o marime nenegativa care descreste cand aplicam definitia) - la siruri recurente: indicele (nenegativ; mai mic in corpul definitiei) - la obiecte: dimensiunea (definim obiectul prin alt obiect mai mic) ? xn+1 = 2   xn ? xn = xn | i 3 ? an = a   a     a (de n ori) ? o fraza e o insiruire de cuvinte ? un sir e un sir mai mic urmat de un alt sir mai mic ? un sir e un caracter urmat de un sir 0 definitie recursiva trebuie sa fie bine formata (v conditiile 1-3) ceva nu se poate defini doar in functie de sine insusi NU: x = f( se pot utiliza doar notiuni deja definite nu se poate genera un calcul infinit (trebuie sa se opreasca) O lista е о insiruire ordonata de elemente de acelasi tip Definitie recursiva: (niciun element) sau urmat de Definitie recursiva =г prelucrarile de liste sunt natural recursive Tipul lista e predefinit in ML parametrizat cu tip arbitrar de elemente: ’a list ex tipul unei liste de intregi e int list Lista vida (de orice tip): П Valori de tip lista: intre [ ] cu separator ; Operatorul construieste o lista, dintr-un cap (element) si alta lista 1 :: ;; - : int list = Pentru a lucra cu liste, trebuie sa putem: identifica ( ) lista vida: П un element (cap) cu o lista: : : o lista in cap si rest (coada) Listele se pot prelucra cu (pattern matching) pentru cele 2 cazuri: match lista with П -> exprl i cap :: coada -> expr2 Constructia de mai sus e o , cu rezultatul exprl daca lista e vida; altfel, identificatorii cap si coada sunt la cele doua parti ale listei, si pot fi folositi in expr2, a carei evaluare da rezultatul let rec mem x ist = match ist with (* x membru in ist ? *) П -> false i h :: t -> x = h or mem x t sau mai scurt, cu : functie cu pattern matching pe argument let rec mem x = function П -> false i h :: t -> x = h or mem x t introducere 1 - dezvoltat in 1972 la de Dennis Ritchie - folosit pentru scrierea de sisteme de operare si utilitare (C dezvoltat initial sub UNiX, apoi UNiX a fost rescris in C) carte: Brian Kernighan, Dennis Ritchie: (1978) Un limbaj vechi, dar in evolutie - standardul ANSi C, 1988 (American National Standards institute) - versiunea curenta: C99 (standard iSO 9899) - foarte : acces direct la reprezentarea binara a datelor, libertate in lucrul cu memoria, buna interfata cu hardware - limbaj , baza mare de cod (biblioteci pentru multe scopuri) - : compilatoare bune, genereaza cod compact, rapid - : foarte usor de facut ! Programarea calculatoarelor Curs 1 Marius Minea introducere 2 niste date de intrare prin niste calcule (matematice) (scrie) niste rezultate in matematica, efectuam calcule cu ajutorul - diverse functii (sin, cos, etc ) - functii noi (depinzand de problema) - functiile existente si definite de noi - si le intr-o anumita ordine Toate aceste aspecte le intalnim si in programare Programarea calculatoarelor Curs 1 Marius Minea introducere 3 Exemplu: functia de ridicare la patrat pentru intregi int sqr(int x) sqr : 'Z sqr(x) = x • x return x * x; unei functii contine: - functiei: specifica un domeniu de valori (intregi), functiei si parametrii acesteia (un singur parametru, intreg) — functiei: aici, o singura (return) cu o care da valoarea functiei (pornind de la parametri) numele Limbajul are precise de scriere ( ): - diversele elemente scrise intr-o anumita ; - se folosesc pentru a le delimita precis: ( ) Programarea calculatoarelor Curs 1 Marius Minea introducere 4 Ridicarea la patrat pentru numere reale sqrf : iR iR float sqrf(float x) sqrf(x) = x • x return x * x; - o alta functie decat cea dinainte: alt domeniu de definitie si de valori - trebuie sa-i dam alt nume daca o folosim in acelasi program - strict vorbind si operatia * e alta, fiind definita pe alta multime Cuvintele int, float denota Un e o impreuna cu un permise pentru aceste valori Alt tip pentru reali: (dubla precizie) recomandabil fata de float (si folosit de functiile standard) Programarea calculatoarelor Curs 1 Marius Minea introducere 5 Exista diferente importante intre tipuri numerice in C si matematica, -in matematica, c iR, ambele sunt infinite, iR e densa — in C, int si float sunt tipuri finite; realii au precizie finita numerice au tip determinat de modul de scriere: 2 e un intreg, 2 0 e un real putem scrie un real in notatie stiintifica: 1 0e-3in loc de 0 001 sunt echivalente scrierile 1 0 si 1 respectiv o l si 1 - unele operatii sunt diferite pentru intregi si reali: e !!! 7   2 da valoarea 3, pe cand 7 0   2 0 da valoarea 3 5 -7   2 da valoarea -3, deci la fel cu - (7   2) Operatorul (scris ° 0) e definit doar pentru intregi 9 5 este 1 9 % 5 este 4 9   -5 este -1 9 ° 0 -5 este 4 -9 5 este -1 -9 % 5 este -4 -9   -5 este 1 -9 ° 0 -5 este -4 semnul restului e acelasi cu semnul deimpartitului e valabila egalitatea a == a   b * b + a ° 0 b (ecuatia impartirii cu rest) Programarea calculatoarelor Curs 1 Marius Minea introducere б - : au un inteles predefinit (nu poate fi schimbat) Exemple: instructiuni (return), tipuri (int, float, double), etc - (de ex sqr, x) alesi de programator pentru a denumi functii, parametri, variabile, etc Un identificator e o secventa de caractere formata din litere (mari si mici), liniuta de subliniere si cifre, care nu incepe cu o cifra si nu este un cuvant cheie Exemple: x3, al2 34, exit, main, printf, intl6 t - (numerice: -2, 3 14; mai tarziu: caractere, siruri) - , cu diverse semnificatii: * e un operator ; delimiteaza sfarsitul unei instructiuni parantezele ( ) grupeaza parametrii unei functii sau o subexpresie acoladele { } grupeaza instructiuni sau declaratii etc Programarea calculatoarelor Curs 1 Marius Minea introducere 7 Exemplu: discriminantul ecuatiei de gradul ii: a • x2 + b • x + c = 0 float discrim(float a, float b, float c) return b*b-4*a*c; intre parantezele rotunde ( ) din antetul functiei putem specifica oricati parametri, fiecare cu tipul propriu, separati prin virgula Programarea calculatoarelor Curs 1 Marius Minea introducere 8 Pana acum, am functii, fara sa le folosim Valoarea unei functii poate fi folosita intr-o expresie cu aceeasi sintaxa ca si in matematica: functie(parametru, parametru, parametru) Exemplu: in discriminantul dinainte, puteam scrie: return sqrf(b) - 4 * a * c; Sau putem defini: int cube(int x) return x * sqr(x); iMPORTANT: inainte de a folosi orice identificator (nume) in C, el trebuie sa fie (trebuie sa stim ce reprezinta) => Exemplele sunt corecte daca sqrf respectiv sqr sunt definite inainte de discrim, respectiv cube in program Programarea calculatoarelor Curs 1 Marius Minea introducere 9 int main(void) { return 0; - cel mai mic program: nu face nimic ! - orice program contine functia si e executat prin apelarea ei (programul poate contine si alte functii) -in acest caz: functia nu are parametri ( ) void e un cuvant cheie pentru tipul vid (fara nici un element) - cf standard: main returneaza un cod intreg catre sistemul de operare (conventie: 0 pt terminare cu succes, Ф 0 pt cod de eroare) Programarea calculatoarelor Curs 1 Marius Minea introducere 10  * Acesta este un comentariu *  int main(void)    comentariu pana la capat de linie  * Acesta e un comentariu pe mai multe linii obisnuit, aici vine codul programului *  return 0; - programele pot contine comentarii, inscrise intre  * si *  sau incepand cu    si terminandu-se la capatul liniei - orice continut intre aceste caractere nu are nici un efect asupra generarii codului si executiei programului - programele comentate - pentru ca un cititor sa le inteleaga (altii, sau noi, mai tarziu) - ca documentatie si specificatie: functionalitate, restrictii, etc - ce reprezinta parametrii functiilor, rezultatul, variabilele, ce conditii trebuie indeplinite, cum se comporta la eroare Programarea calculatoarelor Curs 1 Marius Minea introducere 11 #include int main(void) printf("hello, world! n");    tipareste un text return 0; - printf (de la "print formatted"): o functie standard (N B : printf nu este instructiune sau cuvant cheie) - e apelata aici cu un parametru sir de caractere - constantele sir de caractere: incluse intre ghilimele " " -  n este notatia pentru caracterul de linie noua - prima linie e o , include fisierul stdio h cu functiilor standard de intrare   iesire - = informatiile (nume, parametri) necesare pentru folosire - (codul obiect, compilat): intr-o biblioteca din care compilatorul ia cele necesare pentru generarea programului executabil Programarea calculatoarelor Curs 1 Marius Minea introducere 12 #include #include #include int main(void) int sqr (int x) { return x * x; } int main(void) printf("cos(0) = "); printf ("° of ii > cos(0)); printf("2 ori -3 la patrat e "); printf ("° od" , 2 * sqr(-3)); return 0; return 0; Pentru a tipari valoarea unei expresii, printf ia doua argumente: - un sir de caractere (specificator de format): ° od (intreg, decimal), ° of (real, floating point) - expresia, al carei tip trebuie sa fie compatibil cu cel indicat (verificarea cade in sarcina programatorului !!!) : instructiunile unei functii se executa una dupa alta — exceptii: instructiunea return incheie executia functiei (dupa ea nu se mai executa nimic) Programarea calculatoarelor Curs 1 Marius Minea introducere 13 abs : —> , z x f x x > 0 abs(x) = 0 sau nu) => e necesara o facilitate de limbaj pentru a decide valoarea pe care o ia o expresie in functie de valoarea unei conditii (adevarat fals) Programarea calculatoarelor Curs 1 Marius Minea introducere 14 O in C are sintaxa: conditie ? exprl : expr2 - daca conditia e adevarata, se evalueaza doar exprl, si intreaga expresie ia valoarea acesteia - daca e falsa, se evalueaza doar expr2 si intreaga expresie ia valoarea acesteia int abs(int x) return x >= 0 ? x : -x;    operator minus unar Operatori de comparatie in C: == (egalitate), != (diferit), , >= iMPORTANT! Testul de egalitate in C e == si nu = simplu !!! Obs : Functia abs exist ca functie standard, declarata in stdlib h Programarea calculatoarelor Curs 1 Marius Minea introducere 15 sgn : Z, {-1,0,1} i —1 x 0 Chiar cu operatorul conditional nu putem transcrie functia direct in C (el permite doar decizia cu doua ramuri (adevarat fals), nu cu un numar mai mare de conditii   ramuri) => trebuie sa descompunem calculul functiei sgn (de fapt decizia asupra valorii parametrului ж) - mai mici: principiu foarte important in rezolvarea de probleme Rescriem functia cu o singura decizie in fiecare punct: sgn(x) = daca x 0) -1 ( daca x = 0 | altfel (ж > 0) 0 1 Programarea calculatoarelor Curs 1 Marius Minea introducere 16 sgn(x) = daca x 0) -1 ( daca x = 0 0 | altfel (ж > 0) 1 return x int sqr(int x) { printf ("Patratul lui ° od e ° od n" , x, x*x); return x * x; int main(void) { printf ("2 la a 6-a e ° od n" , in ce ordine se scrie pe ecran ? Patratul lui 2 e 4 sqr(2 * sqr(2))); Patratul lui 8 e 64 return 0; 2 la a 6-a e 64 in C, transmiterea parametrilor la functii se face - se (calculeaza valoarea) toate argumentele functiei - valorile se atribuie la (numele din def fct ) - apoi se incepe executia functiei cu aceste valori Programarea calculatoarelor Curs 1 Marius Minea introducere 18 in exemplu: programul incepe cu executia lui main, deci tiparirea printf - printf are nevoie de valoarea argumentelor sale Prima se stie (o ), a doua trebuie calculata: sqr(2 * sqr(2)) - pentru a efectua apelul exterior al lui sqr trebuie stiut argumentul, adica 2 * sqr(2) Deci se efectueaza intai apelul interior, sqr(2) => ordinea: sqr(2), apoi sqr(8), apoi printf din main Cum s-ar mai putea altfel, dar in C: : functia incepe executia si isi calculeaza argumentele la nevoie - printf ar tipari intai 2 la puterea 6 e, apoi ii trebuie valoarea - ar apela sqr exterior care scrie Patratul lui, apoi ii trebuie x - ar apela sqr(2) care scrie Patratul lui 2 e 4, returneaza 4, etc : se substituie argument pentru parametrii functiei - din printf s-ar apela sqr exterior cu 2 * sqr(2) - pt a calcula (2*sqr(2))*(2*sqr(2)) s-ar apela sqr(2) de doua ori => in C, o functie calculeaza numai cu , niciodata cu Programarea calculatoarelor Curs 1 Marius Minea Marius Minea 5 octombrie 2005 introducere - 2 5 ore de curs: miercuri 8-9:30, - 2 ore de laborator (B426) prep ing Gabriela Bobu, drd ing D - 60% examen 1 2 partial (30%), 1 2 fina - 40% activitate pe parcurs (labor Consultatii: la birou (B 531) - o ora fixa pe saptamana (libera - sau stabiliti o alta ora prin e-ma Pagina de curs: la http:  www es и Programarea calculatoarelor Curs 1 2 , marti 12:30-13:30 (R611) an Ciresan, prep ing Elena Doandes il (30%) ator) in orar): Luni 11-12 ? il (mariusQcs utt ro) Ltt ro  marius curs pc2 Marius Minea introducere 3 Scopul cursului: din voi sa programati bine in C - laborator cu probleme realiste - experienta de la laborator esentiala pentru examen -invatati materia dupa fiecare curs - spuneti ce e dificil de inteles (si cum ati invata mai bine) - veniti la consultatii in caz de nelamuriri - invatati impreuna prezentati solutiile altora (modificate sau nu) ca ale voastre - carti, articole, pagini de web, idei ale altora - oriunde: in teme, proiecte, prezentari, lucrarea de diploma Programarea calculatoarelor Curs 1 Marius Minea introducere 4 - conceptul de compilator: descris prima data de Grace Hopper (1952) - 1954-1957: limbajul si compilatorul FORTRAN (John Backus, iBM) - 1958: LiSP (LiSt Processing, John McCarthy, la MiT) - 1959: COBOL (Common Business Oriented Language) dezvoltat de CODASYL: Committee on Data Systems Languages - 1960: ALGOL 60: limbaj structurat, a inspirat multe altele - 1964: BASiC (John Kemeny, Tom Kurtz; la Dartmouth) - 1967: SiMULA (Ole-Johan Dahl, Kristen Nygaard): primul limbaj orientat pe obiecte ! - 1968: Edsger W Dijkstra: "GO TO Considered Harmful" - principiile programarii structurate - 1971: PASCAL (Niklaus Wirth); ulterior MODULA-2 Programarea calculatoarelor Curs 1 Marius Minea introducere 5 - dezvoltat si implementat in 1972 la АТ&Т Bell Laboratories de Dennis Ritchie http:  cm bell-labs coin cin cs who dinr chist htinl - contextul: evolutia conceptului de (ALGOL 68 BCPL В C) - necesitatea unui limbaj pentru (legatura stransa cu dezvoltat la Bell Labs) - C dezvoltat initial sub UNiX; in 1973, UNiX rescrisin totalitate in C - cartea de referinta: Brian Kernighan, Dennis Ritchie: (1978) -in 1988 (vezi K&R editia ii) limbajul a fost standardizat de ANSi (American National Standards institute) - dezvoltari ulterioare: C99 (standard iSO 9899) Programarea calculatoarelor Curs 1 Marius Minea introducere б - produce un cod (compact in dimensiune, rapid la rulare) apropiat de eficienta limbajului de asamblare (fiind un limbaj relativ simplu, cu compilatoare mature) - permite programarea , apropiat de hardware acces la reprezentarea binara a datelor mare libertate in lucrul cu memoria foarte folosit in programarea de sistem, interfata cu hardware - limbaj de programare (functii, blocuri) - limbaj de nivel : tipuri, operatii, instructiuni simple fara facilitatile complexe ale limbajelor de nivel (foarte) inalt (nu: tipuri multime, concatenare de siruri, etc ) - => pericol mai mare de erori conversii implicite si explicite intre tipuri, ex char e tip intreg, etc Programarea calculatoarelor Curs 1 Marius Minea introducere Pascal litere mari si mici: la fel declaratii in ordine: const, type, subprograme, program principal proceduri si functii integer real boolean varl, var2 : tip; nume: arrayljnin max] of tip; Programarea calculatoarelor Curs 1 7 С diferite!! (case sensitive) declaratii in orice ordine prog principal = functia main functii (pot returna si nimic) int float, doubie (precizii diferite) se foloseste int (valori 0 si 1) t pvarl, var2; tip nume [lung] ; indici de la o la lung - 1 Marius Minea introducere Pascal begin end ; e separator de instructiuni if conditie then instr while conditie do instr repeat instr until cond for cnt := min to max do instr nume fct := expr { } sau (* *) Programarea calculatoarelor Curs 1 ; e terminator de instructiuni if conditie instr while conditie instr do instr while for (expJnit-, exp-test-, expJncr) instr return expr ;  * *  sau    Marius Minea introducere 9 void main(void) { } - cel mai mic program: nu face nimic ! - orice program contine functia si e executat prin apelarea ei (programul poate contine si alte functii) -in acest caz: functia nu returneaza nimic (primul ), si nu are parametri (al doilea ) Cf standard: main returneaza un cod intreg catre sistemul de operare (conventie: 0 == terminare cu succes, != 0: cod de eroare) int main(void) return 0; Discutam ulterior: main poate avea parametri (argumentele liniei de comanda) Programarea calculatoarelor Curs 1 Marius Minea introducere 10  * Acesta este un comentariu *  int main(void)    comentariu pana la capat de linie  * Acesta e un comentariu pe mai multe linii obisnuit, aici vine codul programului *  return 0; - programele pot contine , inscrise intre  * si *  sau incepand cu    si terminandu-se la capatul liniei (ca in C++) - orice continut intre aceste caractere nu are nici un efect asupra generarii codului si executiei programului - programele comentate - pentru ca un cititor sa le inteleaga (altii, sau noi, mai tarziu) - ca documentatie si specificatie: functionalitate, restrictii, etc - ce reprezinta variabilele, parametrii functiilor, rezultatul, ce conditii sunt necesare, cum se comporta la eroare, etc Programarea calculatoarelor Curs 1 Marius Minea introducere 11 #include int main(void) printf("hello, world! n");    tipareste un text return 0; - prima linie: obligatorie pentru orice program care citeste sau scrie = o , include fisierul stdio h care contine (NU implementarea) functiilor standard de intrare iesire = informatiile (nume, parametri) necesare compilatorului pt a le folosi - implementarea (cod obiect, compilat): intr-o biblioteca inclusa (linkeditata) la compilarea programului utilizator - printf ("print formatted"): o functie standard - N B : printf nu este o instructiune sau cuvant cheie - e apelata aici cu un parametru sir de caractere - sirurile de caractere: incluse intre ghilimele duble " -  n este notatia pentru caracterul de linie noua Programarea calculatoarelor Curs 1 Marius Minea introducere 12 int main(void) { int sum;    declaram o variabila intreaga int a = 2, b;    o variabila initializata, alta nu b = 3; sum = a + b; return 0;    semnul de atribuire in C este = - o variabila trebuie (cu tipul ei) inainte de folosire - poate fi optional la declarare - cateva tipuri standard: caracter char, intreg int, real float - corpul unei functii formeaza un , intre { si } - contine , urmate de o in ANSi C, instructiunile vin dupa declaratii (nu se pot amesteca) in C++ si C99, se pot intercala oricum Programarea calculatoarelor Curs 1 Marius Minea introducere 13 #include int main(void) int x; x = 5; printf("Numarul x are valoarea: printf ("° od" , x) ; return 0; Pentru a tipari valoarea unei expresii, printf ia doua argumente: - un sir de caractere (specificator de format): 7oC (caracter), ° od (intreg), ° of (float), ° os (sir), etc - expresia, al carei tip trebuie sa fie compatibil cu cel indicat (verificarea cade in sarcina programatorului !!!) Programarea calculatoarelor Curs 1 Marius Minea introducere 14 #include int main(void) int x; scanf ("° od", &x) ; printf ("° od" , x) ; return 0; - scanf: functie de citire formatata, perechea lui printf - primul argument (sirul de format) la fel ca la printf - deosebirea: inainte de numele variabilei apare operatorul & (adresa) in C, parametrii se pot transmite primind lui x (prin valoare!), scanf stie unde sa puna valoarea Citirea unui caracter: cu functia getcharO char c;    mai bine: int, discutam mai tarziu c = getcharO ; Programarea calculatoarelor Curs 1 Marius Minea introducere #include int main(void) int a, b, sum; printf("introduceti scanf ("° od", &a);  * printf("introduceti scanf ("° od", &b) ; un numar: "); numarul se cit alt numar: "); sum = a + b; printf ("Suma este ° od n" , sum); return 0; Programarea calculatoarelor Curs 1 15 este in variabila a *  Marius Minea introducere 16 in Pascal, read write(in) ia oricate argumente, de orice tip; compilatorul trateaza detaliile de formatare specifice fiecarui tip in C, printf scanf iau tot un numar arbitrar de argumente: - primul este un sir de caractere (care indica formatul) - restul: expresii (printf) sau adrese (scanf) cu tipuri corespunzatoare celor indicate in sirul de format int x, y; scanf ("7odo od", &x, &y) ; printf ("Suma lui ° od si ° od este ° od n", x, y, x + y) ; Programarea calculatoarelor Curs 1 Marius Minea introducere 17 #include int main(void) int x; printf("introduceti un numar: scanf ("° od", &x) ; if (x , = intrebare: ce face fragmentul urmator pentru x = -1, у = -2 ? if (x > 0) if (y > 0) printf("unu"); else printf("doi"); Raspuns: else apartine de cel mai apropiat if (precedent) Programarea calculatoarelor Curs 1 Marius Minea introducere #include int main(void) char c; int words = 0; c = getcharO ;  * citeste un ca while (c == ’ ’) c = getcharO; while (c != ’ n’) { words = words + 1; while (c != ’ ’ && c != ’ n’) while (c == ’ O c = getchar( printf ("° od cuvinte n" , words); return 0; Programarea calculatoarelor Curs 1 19 racter de la intrare *   * spatii la inceput *  c = getcharO;  * cuvant *  );  * spatii *  Marius Minea introducere 20 Multe programe "interesante" au cicluri (sau recursivitate) Trebuie: - sa proiectam programul asa incat - sa fim siguri ca la iesirea din ciclu da rezultatul dorit Cum ? Nu prin incercari, ci rationand dupa o anumita schema: - ce stim la inceputul ciclului ? - ce stim dupa fiecare iteratie ? se pastreaza o anumita proprietate ? - ce dorim sa deducem la sfarsit ? => cautam un (proprietate) adevarat(a) la fiecare iteratie Fie programul while ( E ) do S; Vrem sa demonstram ca dupa terminare e adevarata proprietatea Q Cautam un i cu urmatoarele proprietati: -ie adevarat inainte de a incepe ciclul while - daca i si E sunt adevarate (se intra in ciclu), dupa executia corpului S, e din nou adevarat i - daca i e adevarat si E e fals (ciclul s-a terminat), putem deduce Q Programarea calculatoarelor Curs 1 Marius Minea introducere 21 #include int main(void) int m, lo = 0, hi = 1023; printf("Ganditi-va la un numar intreg intre 0 si printf ("° od n" , hi) ; do {    invariant: lo m, deci N >= m + 1, deci facem lo = m + 1; * daca nu, atunci N lo = N = hi printf ("Numarul este ° od ! n", lo) ; return 0; Programarea calculatoarelor Curs 1 Marius Minea introducere sirul lui Fibonacci: Fq = F± = #include int fib(int n) if (n int main(void) int n, f, fl, f2; printf("introduceti numarul n: scanf ("° od", &n) ; printf ("Fibonacci (° od) = ", n) ; f = 1; fl = 1;    f = fib(k); fl = fib(k-l); cu к = 1 n = n - 1; while (n > 0) {    invariant: k+n = N (val data pt n) f2 = fl;    f2 = fib(k-l) fl = f;    fl = fib(k) f = fl + f2;    f = fib(k+l), deci к creste cu 1 n = n - 1;    n scade cu 1 printf ("° od n" , f ) ; return 0; Programarea calculatoarelor Curs 1 Marius Minea Marius Minea 5 octombrie 2004 introducere 2 - familiaritate cu sisteme PC, lucru cu fisiere, medii de programare -in principal la laborator - de la exemple la programe pentru situatii reale - programarea = dezvoltarea unui produs software, de la A la Z - buna cunoastere a unui limbaj de programare si un punct de plecare pentru altele - principii si stil de programare Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 3 - program executabil: cod masina interpretabil direct de calculator - program sursa: in limbaj inteligibil de programatorul uman din format sursa in format executabil: - compilare: anterior rularii programului (pt С, C++, PASCAL) - interpretare: direct la rulare: (pt variante de BASiC, LiSP) in mod tipic, un program generic: - citeste - efectueaza - produce niste (calcule) asupra lor la iesire Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 4 de prelucrare (CPU) - unitate de control - unitati aritmetice si logice pentru calcul primara: circuite integrate secundara: medii magnetice (disc fix, floppy), optice (CD) (dispozitive de intrare iesire) tastatura, mouse, ecran, imprimanta, joystick Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 5 John von Neumann (1945) - propune arhitectura mentionata (control, UAL, memorie, i O) - si conceptul de (deosebirea esentiala, de ex fata de calculatorul de buzunar, actionat direct de utilizator) Acestea stau la baza tuturor calculatoarelor conventionale Functionarea: 1 citeste instructiunea de la adresa din numaratorul de program 2 inainteaza numaratorul de program la urmatoarea instructiune 3 unitatea de control decodifica instructiunea si comanda operatia (care poate modifica registri, memoria, numaratorul de program) 4 se reia ciclul de la punctul 1 Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere б - unui sistem de calcul (timpul de procesare al unitatii centrale, memoria, perifericele, sistemul de fisiere) - creeaza o interfata - ofera utilizate din limbaje de programare (alocare de memorie, citire, tiparire) Vom programa: sub Windows in semestrul i, sub Linux in semestrul ii Urmarim: scrierea de programe , independent de sistemul de operare si mediul de programare folosit Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere - Definirea si analiza specificatiilor - Proiectare - implementare (Codare) - Testare - Mentenanta Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 8 La curs: reprezentate de enuntul problemei in realitate insa: - adesea cea mai dificila parte - trebuiesc eliminate ambiguitatile - neintelegerile au efecte pentru tot restul proiectului - important: nu "ce stiu eu sa fac" ci "ceea ce se cere" (de client) - arhitectura programului -impartirea in componente si interfata intre ele - proiectarea structurilor de date - proiectarea algoritmilor - interfata cu utilizatorul Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 9 - ce face programul ? pot defini in mod precis ? (absolut necesar!) - pot gasi o relatie matematica ? - pot urmari pas cu pas transformarea pe care o efectueaza programul si sa demonstrez (sa ma conving) astfel ca rezultatul final e corect ? - ce se schimba pe parcursul programului ? ce ramane neschimbat ? (exemplu: folosirea invariantilor in rationamentul despre cicluri) - urmarirea rationamentului in faza de implementare reduce erorile - ce presupuneri garantii exista despre intrare ? - ce presupuneri garantii exista despre alte module de program ? - cum se comporta programul: pentru date normale, limita, eronate care e performata pt date de dimensiuni mari ? Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 10 - complexitatea sistemului creste pe masura realizarii - documentatie necesara pentru: - descriere exacta a functionalitatii sistemului, impreuna cu toate cerintele, restrictiile, presupunerile - comunicarea dintre programatori (chiar pt programatorul initial!) - proiectarea de teste, evolutia si mentenanta ulterioara - cat de generala este solutia ? poate fi reutilizata ? - se pot folosi elemente existente ? (functii de biblioteca, module de program, obiecte, etc ) - programul e proiectat pentru a fi intretinut usor ? - robustete, rezistenta la date de intrare invalide Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 11 - 2 ore de curs - 1 ora de seminar (2 la 2 saptamani): prep ing Gabriela Bobu - 2 ore de laborator: prep ing Elena Doandes -60% examen 1 2 partial (30%), 1 2 final (30%) -40% activitate pe parcurs (30% laborator, 10% seminar) Consultatii: la birou (B 531) - o ora fixa pe saptamana (libera in orar): joi 8-10 ? - sau stabiliti o alta ora prin   (mariusQcs utt ro) Pagina de curs: la http:  www cs utt ro  marius curs upc Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 12 Scopul cursului: din voi sa programati bine in C => laboratorul si examenul evalueaza rezultatele (nu colectiv!) - consultati cadrele didactice in caz de nelamuriri — invatati impreuna - prezentati solutiile altora (modificate sau nu) ca ale voastre (nu numai la acest curs): o (carti, articole, pagini de web, idei ale altora) Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 13 = secventa de pasi pentru rezolvarea unei probleme : reprezentarea grafica a unui algoritm - fara particularitatile unui anumit limbaj de programare, dar precis Blocuri (instructiuni) componente in scheme logice: start, stop, atribuire, citire, scriere, decizie var expr schema logica: graf format din cele 6 tipuri de instructiuni, cu un singur nod de START si unul singur de STOP Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 14 - dezvoltat si implementat in 1972 la АТ&Т Bell Laboratories de Dennis Ritchie http:  cm bell-labs coin cin cs who dinr chist htinl - limbaj de (blocuri, cicluri, functii) (concept aparut in ALGOL 60, apoi ALGOL 68, PASCAL, ) - necesitatea unui limbaj pentru (legatura stransa cu dezvoltat la Bell Labs) - C dezvoltat initial sub UNiX; in 1973, UNiX rescrisin totalitate in C - cartea de referinta: Brian Kernighan, Dennis Ritchie: (1978) -in 1988 (vezi K&R editia ii) limbajul a fost standardizat de ANSi (American National Standards institute) - dezvoltari ulterioare: C99 (standard iSO 9899) Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 15 - limbaj de nivel : ofera tipuri, operatii, instructiuni simple fara facilitatile complexe ale limbajelor de nivel (foarte) inalt (nu: tipuri multime, concatenare de siruri, etc ) - limbaj de programare (functii, blocuri) - permite programarea , apropiat de hardware acces la reprezentarea binara a datelor mare libertate in lucrul cu memoria foarte folosit in programarea de sistem, interfata cu hardware - produce un cod (compact in dimensiune, rapid la rulare) apropiat de eficienta limbajului de asamblare datorita caracteristicilor limbajului, si maturitatii compilatoarelor - necesita mare atentie in programare conversii implicite si explicite intre tipuri, char e tip intreg, etc Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 16 void main(void) { } - cel mai mic program: nu face nimic ! - pornind de la el, scriem orice program, adaugand cod intre { si } - orice program contine functia si e executat prin apelarea ei (programul poate contine si alte functii) -in acest caz: functia nu returneaza nimic (primul ), si nu are parametri (al doilea ) Vom discuta: main poate lua si argumente, si returna un int Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 17  * Acesta este un comentariu *  void main(void)    comentariu pana la capat de linie  * Acesta e un comentariu pe mai multe linii obisnuit, aici vine codul programului *  - programele pot contine , inscrise intre  * si *  sau incepand cu    si terminandu-se la capatul liniei (ca in C++) - orice continut intre aceste caractere nu are nici un efect asupra generarii codului si executiei programului - programele comentate - pentru ca un cititor sa le inteleaga (altii, sau noi, mai tarziu) - ca documentatie si specificatie: functionalitate, restrictii, etc Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 18 #include void main(void) printf("hello, world! n");  * tipareste un text *  - prima linie: obligatorie pentru orice program care citeste sau scrie = o , include fisierul stdio h care contine declaratiile functiilor standard de intrare iesire - adica informatiile (nume, parametri) necesare compilatorului pt a le folosi corect - printf ("print formatted"): o functie standard implementata intr-o biblioteca care e inclusa (linkeditata) la compilare - N B : printf nu este o instructiune sau cuvant cheie - e apelata aici cu un parametru sir de caractere - sirurile de caractere: incluse intre ghilimele duble " -  n este notatia pentru caracterul de linie noua Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 19 void main(void) { int sum;  * declaram o variabila intreaga *  int a, b;  * declaram inca doua variabile intregi *  a = 2; b = 3; sum = a + b;  * semnul de atribuire in C este = *  - pentru a memora data si calcula, avem nevoie de o variabila are un , un si o - o variabila trebuie (cu tipul ei) inainte de folosire - cateva tipuri standard: caracter char, intreg int, real float - corpul unei functii formeaza un , intre { si } - blocul poate contine si o de instructiuni Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 20 #include void main(void) int x; x = 5; printf("Numarul x are valoarea: printf ("° od" , x) ; Pentru a tipari valoarea unei expresii, printf ia doua argumente: - un sir de caractere ( ): %c (caracter), %d (intreg), %s (sir), etc - expresia, al carei tip trebuie sa fie compatibil cu cel indicat (verificarea cade in sarcina programatorului !!!) Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 21 #include void main(void) int x; scanf ("° od", &x) ; printf ("° od" , x) ; - scanf: functie de citire formatata, perechea lui printf - primul argument (sirul de format) la fel ca la printf - deosebirea: inainte de numele variabilei apare operatorul & (adresa) transmitand explicit lui x, scanf stie unde sa puna valoarea Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere #include void main(void) int a, b, sum; printf("introduceti scanf ("° od", &a) ;  * printf("introduceti scanf ("° od", &b) ; un numar: "); numarul se cit alt numar: "); sum = a + b; printf ("Suma este ° od n" , sum); Obs :  n este caracterul de linie noua Utilizarea si programarea calculatoarelor Curs 1 22 aste in variabila a *  Marius Minea introducere #include void main(void) int x; printf("introduceti un numar: "); scanf ("° od", &x) ; if (x , = Utilizarea si programarea calculatoarelor Curs 1 Marius Minea Functionarea corecta a sistemelor Ce sunt metodele formale ? Domenii si exemple de aplicatie Modelare si specificare Verificare formala Curs 1 2004 importanta si dificultate Marius Minea Metode formale introducere 2 - urmarirea corectitudinii sistemelor proiectate - cunoasterea principalelor tipuri si surse de erori - cunoasterea metodelor formale ca alternativa la simulare si testare - obisnuinta cu rigoarea in descrierea sistemelor - construirea de modele corespunzatoare pentru sistemele proiectate - exprimarea neambigua a specificatiilor (proprietatilor dorite) - evaluarea aplicabilitatii metodelor formale (manuale sau automate) - cunoasterea unor utilitare de verificare Verificare formala Curs 1 Marius Minea Metode formale introducere 3 - aparat medical pentru terapie cu radiatie - 6 accidente cu morti si rani grave (1985-87, SUA, Canada) - cauza directa: erori in programul de control [Leveson 1995]: incredere excesiva in software (in analiza produsului) lipsa masurilor de siguranta hardware lipsa practicilor de (proiectare defensiva, specificare, documentatie, simplitate, analiza formala, testare) Verificare formala Curs 1 Marius Minea Metode formale introducere 4 - Autodistrugere dupa o defectiune la 40 s de la lansare (1996) - Cauza: conversia 64-bit float 16-bit int genereaza o exceptie de depasire netratata in programul ADA - Cost: 500 milioane dolari (racheta), 7 miliarde dolari (proiectul) principala cauza: cod preluat de la Ariane 4, fara reanalizare corespunzatoare: - executia nu mai era necesara in timpul erorii - analiza absentei depasirii pentru variabilele neprotejate proiectarea gresita a sistemul de referinta inertial si cel de rezerva scoase din functiune de aceeasi eroare Verificare formala Curs 1 Marius Minea Metode formale introducere 5 Eroare in unitatea deimpatire cu virgula mobila, 1994 algoritm de impartire cu refacere, in baza 4 determina urmatoarea cifra din cat dintr-un tabel cateva intrari marcate gresit ca "don’t care" cost: cca 500 milioane dolari Circuitul putea fi verificat formal - demonstrare automata de teoreme [Clarke, German & Zhao] - cu structuri speciale de date pentru reprezentarea inmultirii  impartirii [Bryant & Chen] dar accentul a fost pus pe componente mai complexe (unitatea de executie, coerenta memoriei cache) Verificare formala Curs 1 Marius Minea Metode formale introducere 6 , 1997 • ajunsa pe Marte, proba spatiala se reseta frecvent • cauza: intre procese cu resurse comune • fenomenul si solutia: cunoscute in literatura de specialitate ! [Sha, Rajkumar, Lehoczky Priority inheritance Protocols, 1990] 1 procesul A de prioritate mica obtine resursa R 2 A intrerupt de C (prioritate mare) 3 C asteapta eliberarea lui R; A revine in executie 4 A intrerupt de В (prioritate medie, A C asteapta dupa B, fara a fi direct conditionat de В ! Solutia: ridicarea prioritatii unui proces care obtine o resursa (A) la nivelul celui mai prioritar proces care poate solicita resursa (C) Verificare formala Curs 1 Marius Minea Metode formale introducere 7 , 1998 • dezintegrare la intrarea in atmosfera • eroarea tehnica: discrepanta intre unitati de masura in sistemele anglo-american si metric • erori multiple de proces: , 1998 • trenul de aterizare e activat prematur la intrarea in atmosfera • socul e interpretat ca aterizare, motoarele sunt oprite • eroarea: Verificare formala Curs 1 Marius Minea Metode formale introducere 8 direct pe produs => teste concludente erorile detectate tarziu sunt costisitoare diagnosticul necesita observabilitate completa efectuata deja in faza de proiectare simulatorul poate fi mai lent decat sistemul real Testarea sau simularea exhaustiva e adeseori imposibila (E W Dijkstra, 1979) Verificare formala Curs 1 Marius Minea Metode formale introducere 9 " limbaje, tehnici si unelte matematice pentru specificarea si verificarea sistemelor" [Clarke & Wing, 1996] Sau, mai in detaliu: "un set de unelte si notatii, - cu o semantica formala, - folosite pentru a specifica neambiguu cerintele unui sistem, - care admite demonstrarea de proprietati ale acelei specificatii - si demonstrarea corectitudinii unei implementari in raport cu acea specificatie" [Hinchey & Bowen, Applications of Formal Methods, 1995] Verificare formala Curs 1 Marius Minea Metode formale introducere 10 Nu exista garantii absolute O metoda formala nu poate fi mai buna decat modelul si specificatiile care sunt folosite - modelul si specificatiile trebuiesc validate Dar pot oferi: o procedura logic consistenta de rationament o acoperire exhaustiva, adeseori imposibila altfel mecanizare si automatizare => performanta si corectitudine Pot cu succes simularea, testarea, etc Verificare formala Curs 1 Marius Minea Metode formale introducere 11 Utilitate indeosebi pentru: - : tehnici de abstractie   aproximare - : foarte greu de reprodus si analizat altfel - : (avionica, bancar, medical, securitate) Dinamica erorilor in software [dupa John Rushby, SRi] 20-50 erori kloc inainte de testare, 2-4 dupa examinarea formala a codului poate reduce erorile inainte de testare de cca 10 ori Studiu de caz pe lOkloc timp real, distribuit: verificare si validare: 52% cost (57% timp) din acesta, 27% cost in examinare, 73% in testare 21% pt 4 defecte in testarea finala, din care 1 de proiectare eliminarea erorilor la examinari detaliate ale codului: de (160fde огідпаі, eficienta decat la testare verificare formala Curs 1 Marius Minea Metode formale introducere 12 [dupa NASA JPL (sondele Voyager, Galileo)] majoritatea: deficiente in specificarea cerintelor si a interfetelor 1 eroare la 3 pagini de cerinte si 21 pagini de cod doar 3 din 197 erau erori de programare 2 3 din erorile functionale: omisiuni in specificarea cerintelor majoritatea erorilor de interfata: datorate proastei comunicari [dupa Kurt Keutzer, UC Berkeley] > 50% din proiecte au erori dupa prima fabricare erorile pe linie de cod hardware trebuie reduse in ritmul cresterii numarului de tranzistori pe chip practic zero erori la nivelele inferioare de implementare problemele sunt in proiectarea la nivel inalt (hazarduri in pipeline, executie nesecventiala, procesoare superscalare, coerenta memoriilor cache, protocoale complexe, etc ) Verificare formala Curs 1 Marius Minea Metode formale introducere 13 Cauzele cele mai frecvente de erori: din conceptie, defecte simultane, interactiuni neprevazute - lipsurile principale: in aplicarea timpurie a metodelor formale - costul principal: eliminarea tarzie a erorilor Potentialul maxim al metodelor formale: - in modelarea si verificarea la nivel inalt - pentru sisteme complexe, concurente, distribuite, reactive, in timp real, tolerante la eroare, etc Verificare formala Curs 1 Marius Minea Metode formale introducere 14 Analiza cerintelor - identifica contradictii, ambiguitati, omisiuni Proiectare - descompunerea in componente si specificarea interfetelor - proiectarea prin rafinare succesiva Verificare Testare si depanare - generarea directionata de cazuri de test Analiza - model abstract, mai putin complex decat sistemul real Verificare formala Curs 1 Marius Minea Metode formale introducere 15 Verificarea echivalentei combinatoriale - este deja standard in utilitarele CAD Verificarea circuitelor secventiale - marile companii au colective speciale (iBM, intel, Motorola, Fujitsu, Siemens, etc ) - folosesc verificatoarele disponibile public sau cele proprii protocoalele de coerenta cache Gigamax si Futurebus+ Motorola 68020: modelat in demonstratorul Boyer-Moore, verificarea codul binar produs de compilatoare AAMP-5 (procesor pentru avionica): modelat in PVS, verificarea microcodului pentru instructiuni procesoare cu pipelining   superscalare tip DLX Verificare formala Curs 1 Marius Minea Metode formale introducere 16 - analiza codului ADA cu anotatii in limbajul SPARK - software "corect prin constructie", cost redus (Traffic Collision Avoidance System) instalat obligatoriu pe avioanele comerciale din S U A alerta si deviere automata in cazul apropierii periculoase specificatia redactata intr-un limbaj formal (RSML) s-a verificat completitudinea si consistenta [Heimdahl, Leveson ’96] s-a abandonat incercarea de a specifica in engleza - Modele formale pentru sisteme complexe sunt fezabile - Pot fi analizate de expertii din domeniul de aplicatie Verificare formala Curs 1 Marius Minea Metode formale introducere 17 Telefonie Specificarea si analiza interactiilor intre diversele caracteristici ale sistemului telefonic Sisteme electronice de consum Verificarea manuala, apoi automata a protocolului de control din componentele audio Philips, Sisteme de control in electronica auto Protocoale de comunicatie Protocoale de securitate Analiza folosind logici speciale pentru a rationa despre mesaje criptate, intrusi, etc Software de sistem Verificarea driverelor de periferice Verificare formala Curs 1 Marius Minea Metode formale introducere 18 Specificarea: necesara in orice metoda formala (poate fi unicul aspect) necesita limbaj cu si definita formal (matematic) Limbajul de specificare defineste: - un domeniu sintactic (notatia) - un domeniu semantic (universul de obiecte considerat) - o definitie precisa a obiectelor care satisfac o specificatie [M Chechik, Automated Verification, curs, U Toronto] Verificare formala Curs 1 Marius Minea Metode formale introducere 19 - un alfabet de simboluri (ex propozitii, operatori logici) - reguli gramaticale pentru formarea unor formule bine definite Domeniul semantic variaza de la limbaj al limbaj: - secvente de stari, secvente de evenimente, structuri de sincronizare (in limbajele de specificare a sistemelor concurente) - functii intrare iesire, relatii, computatii, transformatoare de predicate (in cazul limbajelor de programare) Verificare formala Curs 1 Marius Minea Metode formale introducere 20 (nu trebuie sa reprezinte o functie calculabila) (ex limbajele de programare) (orientate pe proprietati) (ex functionalitate, reactivitate) - descriu comportamentul sistemelor in raport cu proprietatile ce trebuie satisfacute (orientate pe modele) (ex diagrame, conexiuni, ierarhie) - construiesc un model al sistemului folosind notiuni matematice precise (multimi, functii, logica predicatelor) Uneori: acelasi limbaj pentru specificatie si model (sau implementare) => e posibila rafinarea pe nivele succesive de abstractie Verificare formala Curs 1 Marius Minea Metode formale introducere 21 neambigua: un inteles bine definit (NU: limbaj fara semantica formala, limbaj natural, scheme grafice cu mai multe interpretari) consistenta (necontradictorie) - exista cel putin un obiect care o satisface poate fi incompleta - comportament la latitudinea implementarii sau nondeterminism Daca limbajul are un sistem de inferenta logica se pot demonstra proprietati pornind de la o specificatie Verificare formala Curs 1 Marius Minea Metode formale introducere 22 - bazat pe logica de ordinul i si teoria multimilor - descriere functionala, declarativa - folosit extensiv la proiecte industriale in Marea Britanie PhoneDB members : PPerson telephones : Person Phone FindPhones = PhoneDB name? : Person number s  : V*Phone dom phones C members - o schema (PhoneDB) (stari - operatii care schimba starea name? G dom phones number s = phones (|{name? }|) + evtl tranzitii), si un invariant (Д) sau nu (H) Verificare formala Curs 1 Marius Minea Metode formale introducere 23 [Guttag, Hornig, Garlan, MiT DEC SRC] 1 abstractie (specificare) independenta de limbaj 2 specificare de interfata pentru module intr-un anumit limbaj Table: trait includes integer introduces new: -> Tab add: Tab, ind, Val -> Tab lookup: Tab, ind -> Val asserts  forali i, il: ind, v: Val, t: Tab  not (i  in new); i  in add (t, il, v) == i = il    i  in t lookup(add(t, i, v), il) == if i = il then v else lookup(t, il) Verificare formala Curs 1 Marius Minea Metode formale introducere 24 Specificare de interfata pentru limbajul C: mutable type table uses Table(table for Tab, char for ind, char for Val, int for int); constant int maxTabsize; table table create(void) { ensures result’ = new    fresh(result); char table read(table t, char i) requires i  in t*; ensures result = lookup(t , i); - defineste preconditii si postconditii - interfata ramane la nivelul abstract (fara algoritmi) Verificare formala Curs 1 Marius Minea Metode formale introducere 25 — origineaza din eforturile grupului iBM Viena in anii '70 - similara si inrudita cu Z - dezvoltata de Jean-Raymond Abrial - spre deosebire de Z, are si suport automatizat puternic - preconditii   postconditii, invarianti, rafinament - suport pentru generarea automata de cod - utilizare industriala (metroul din Paris, Alsthom, n • lOkloc) Notiuni de specificare de interfata incorporate direct in limbaje, de ex Eiffel (design by contract) Verificare formala Curs 1 Marius Minea Metode formale introducere 26 Doua directii de abordare: - programare imperativa + adaugiri (semafoare, monitoare, rendezvous, etc ) - model de calcul concurent, bazat pe interactiunea proceselor ("interactiune indivizibila" ) Comunicarea si concurenta sunt notiuni complementare [Milner] Communicating Sequential Processes [Hoare] Calculus of Communicating Systems [Milner] Verificare formala Curs 1 Marius Minea Metode formale introducere 27 Exemplu [Hoare]: automat pentru ciocolata, cu monede Alfabetul: ay = {znlp, zn2p, small, large, outlp} Comportamentul: V = {in2p {large V small outlp V)  inlp small V) sau, formal: V = pX {in2p {large X small outlp —> X)  inlp small X) (unica solutie a ecuatiei de mai sus) CSP: formalism (algebra a proceselor) axat pe actiuni, cu nondeterminism, compozitie sincrona, etc Verificare formala Curs 1 Marius Minea Metode formale introducere 28 Variante: - etichete pe stari sau pe tranzitii - tranzitii specificate ca functii sau relatii - augmentat sau nu cu variabile (date) Structura Kripke: = automat etichetat cu propozitii atomice dintr-o multime AP: M = (S,S^R,L) - S: multime finita de stari - Sq: multimea starilor initiale - R C S x S: relatie de tranzitie totala - L : S 2AP: functie de etichetare a starilor Verificare formala Curs 1 Marius Minea Metode formale introducere 29 in general: sistemul (specificatie) Comportament corect - sistemul privit ca realizand o functie intrare iesire - exemplu de formalism: tripletele lui Hoare {P} S {Q} { preconditie } program(sistem) { postconditie } Exemplu de rationament: {P} Si { Q2 {Q2} S2 {R} {P} Si;S2 { ?} Verificare formala Curs 1 Marius Minea Metode formale introducere 30 Comportament corect pentru sisteme reactive: executie (conceptual) infinita comportamentul definit ca reactie la o secventa de intrare specificare: de ex logica temporala proprietati: absenta blocajului, reactie in timp limitat, etc Exemple: - orice cerere este urmata de un raspuns in cel mult 5 secunde - orice proces obtine resursa de un numar infinit de ori - pe orice traiectorie, se ajunge la un moment dat in starea stabila Verificare formala Curs 1 Marius Minea Metode formale introducere 31 Doua mari categorii: - specificarea de regula in logica temporala - algoritmi de explorare exhaustiva verifica valoarea de adevar sau produc o secventa de executie ca si contraexemplu - verificarea echivalentei: specificarea e la randul ei un model - reprezentare intr-un sistem logic cu axiome si reguli de deductie - domeniul analizat reprezentat si el printr-un grup de axiome si reguli (o teorie) - demonstrare mecanizata: ghidata manual sau automata Verificare formala Curs 1 Marius Minea 27 aprilie 2004 Ce este analiza programelor Aplicatii practice recente Analiza fluxului de date: introducere Analiza programelor Curs 1 Marius Minea Analiza programelor introducere 2 istoric: - (sub)domeniu legat de - mai recent: in : in special pentru optimizare ; pentru Scopul: - pentru a deduce proprietati despre comportamentul programelor (in principal corectitudinea, dar si performanta, etc ) Metode: - prin analiza statica a codului sursa (NU executabilul; NU rularea lui) => metoda diferita de simulare sau testare Analiza programelor Curs 1 Marius Minea Analiza programelor introducere 3 Analiza programelor e legata tot mai mult de verificarea formala Verificarea formala: stabileste ca un sistem e corect prin analiza riguroasa a unui model matematic al sistemului -in general, proprietati specifice, detaliate despre comportament (ex dupa evenimentul A apare evenimentul В etc ) - necesita in principiu analiza (simbolica) a secventelor de executie a modelului (explorarea spatiului starilor) Analiza statica: bazata tot pe tehnici matematice, riguroase - de regula pentru proprietati mai generale - folosind aproximatii sigure (conservatoare) - de regula nu exploreaza spatiul starilor programului Analiza programelor Curs 1 Marius Minea Analiza programelor introducere 4 Analiza programelor: tehnici pentru prezicerea statica, la compilare a multimii comportamentelor dinamice (la rulare) ale programului [Nielson & Nielson] in general, o analiza precisa e nedecidabila (v Church, Gddel, Turing) => analiza trebuie sa faca aproximatii => dar trebuie sa fie sigura (sa corespunda semanticii programului, si sa nu omita situatii posibile   erori Din punct de vedere practic: - suficient de precisa (cu minim de avertismente false) - eficienta (spatiu timp) pentru a trata programe de dimensiuni realiste Analiza programelor Curs 1 Marius Minea Analiza programelor introducere 5 [ Patrick Cousot et al 2003 (Ecole Normale Superieure) ] Contextul: programe C fara alocare dinamica si recursivitate ex pentru software de sisteme integrate (embedded) caz specific: software-ul de control de zbor din Airbus A340 Date: 132 000 linii sursa, 2 ani de cercetare si analiza, 1И20’ executie Tipuri de erori la rulare tratate: - comportament nedefinit conform standardului (impartire la zero, depasire de indici de tablou); - comportament dependent de implementare (ex depasire aritmetica), - nerespectarea asertiunilor programatorului: assertO si similare Analiza programelor Curs 1 Marius Minea Analiza programelor introducere 6 typedef enum {FALSE = 0, TRUE = 1} BOOLEAN; BOOLEAN B; void main () { unsigned int X, Y; while (1) {  * *  В = (X == 0);  * *  if (!B) { Y = 1   X;  * *  }  * sursa: Cousot et al *  E usor de detectat vizual corelarea intre в si x dar intr-un program mare, complexitatea analizei creste exponential Analiza programelor Curs 1 Marius Minea Analiza programelor introducere 7 BOOLEAN init; float P, X; void filter () { static float E , S ; if (iNiT) S = P = E = X; else P = ((((0 5 * X - E * 0 7) + E[l] * 0 4) + S * 1 5) - S[l] * 0 7); E[l] = E ; E = X; S[l] = S ; S = P; void main () { X = 0 2 * X + 5; iNiT = TRUE; while (1) { X =0 9 * X + 35; filter (); iNiT = FALSE; } * sursa: dupa Cousot et al *  Problema: demonstrarea absentei depasirilor, si ramanerea lui Pintr-un interval dat (in acest caz, [-1327 05, 1327 05] =>tehnici de analiza pe intervale de valori, cu specific de teoria reglarii Analiza programelor Curs 1 Marius Minea Analiza programelor introducere float x = І ОеЗО, у = x + 1 0e20; printf ("° of n", у - x) ;  * tipareste 0 000000 *  double x; float y, r;  * x = ldexp(l ,50)+ldexp(l ,26); x = 1125899973951488 0; у = x + 1; r = у - x; printf ("° of n" , r) ;  * tipareste 67108864 000000 *  La reprezentarea a numerelor reak Analiza trebuie sa tina cont de ele Analiza programelor Curs 1 8 *  pot aparea erori de rotunjire chiar cumulate dupa ore de rulare! Marius Minea Analiza programelor introducere 9 Clase de erori frecvente in programe: - folosirea variabilelor neinitializate - dereferentierea de pointeri nuli - depasirea limitelor de indici in tablou Aceste erori pot fi detectate prin a codului sursa ex Splint (U Virginia) sau UNO (Bell Labs) pt C sau ESC Java (Compaq SRC) int *p = mallocdOO * sizeof (int)); if (p != NULL) printf ("70d", p ); splint +bounds pointer c pointer c:7:18: Array element p used before deflnition pointer c:7:18: Possible out-of-bounds read: p Problema: analize in acelasi timp (fara multe alarme false) si la programe de dimensiuni mari Analiza programelor Curs 1 Marius Minea Analiza programelor introducere 10 Problema: ce valori poate sa ia o anumita variabila intr-un program ? Mai precis: ce expresii din program pot fi atribuite la o variabila ? Se poate calcula un graf al fluxului de valori (value flow graph) si folosi pentru a detecta eventuale atribuiri de valori eronate Daca apar pointeri, valoarea unei variabile se poate modifica indirect => care sunt toti pointerii care pot indica o anumita variabila ? => pot doi pointeri sa indice spre acelasi obiect {alias) ? - algoritm precis (tine cont de sensul atribuirii, x у [Andersen ’94] cubic, impractic pentru programe mari - algoritm cu unificare (la fel pt x у si у x) [Steensgaard 796] aproape liniar, relativ imprecis - algoritm hibrid [Das’00], practic liniar, precizie apropiata de primul Analiza programelor Curs 1 Marius Minea Analiza programelor introducere 11 [Engler et aL, Stanford ’OO] - meta-compilare - descoperit > 500 de erori in cod sistem (Linux, OpenBSD, etc ) - prin analize statice de tipul celor din compilatoare, combinate cu enuntarea de proprietati si reguli specifice domeniului de aplicatie Exemple: -intreruperile sunt reactivate inainte de intoarcerea din functie: = fiecare cli are o pereche sti pe toate caile de iesire - verificarea in nucleu a pointerilor din spatiul utilizator: = toate utilizarile se fac doar in functii care isi testeaza pointerii - maiioc free: test de pointer nul, neutilizare dupa eliberare - cu intreruperile dezactivate nu apeleaza functii care se pot bloca - utilizarea semafoarelor se face corect, cu apeluri pereche Analiza programelor Curs 1 Marius Minea Analiza programelor introducere 12 [Das, Lerner, Seigle '02 - Microsoft + U Washington] - o analiza statica {property simulatiorT) scalabila la n-100 kloc - exemplu: absenta de erori in > 600 apeluri de sistem pentru 15 pointeri de fisiere in codul gcc (140 kloc) - prin analiza hibrida intre o analiza standard de flux de data (imprecisa) si analiza dependenta de cale (path-sensitive, prea costisitoare) - pastrand corelarea dintre starea proprietatii analizate (ex uninit, open, ciosed pentru fisier) si variabilele relevante din program) if (dump) f = fopen(dumpFil, "w"); if (p) x = 0; else x = 1; if (dump) fclose(f); Analiza programelor Curs 1 Marius Minea Analiza programelor introducere 13 CCured [Necula et aL, UC Berkeley] Securizarea de cod C prin inserarea unui minim de verificari la rulare Problema: folosirea variata si nesigura a pointerilor in limbajul C Solutia: un sistem de tipuri care captureaza modul de folosire a fiecarui pointer din program: safe (doar dereferentiat), seq (cu indice), wild (cu typecast arbitrar) Cum: instrumentare la nivel sursa, modificand reprezentarea pointerilor (adresa de baza + tag + lungime valida pt verificari de indici) - se deduce pentru fiecare pointer tipul cel mai restrictiv - se instrumenteaza cu verificarile necesare (nenul, depasire, etc ) Rezultate: pe cod real (Apache, OpenSSL, OpenSSH, sendmail, bind), cu cca 10%-50% degradare de performanta (cu Purify: 10-100 ori!) Analiza programelor Curs 1 Marius Minea Analiza programelor introducere 14 - Analiza fluxului de date principalele tehnici originare din domeniul compilatoarelor aspecte legate de dualitatea precizie   eficienta - Analiza bazata pe constrangeri cadru general pentru reprezentarea prin relatii de constrangere intre multimi, cu proceduri eficiente si generice de solutionare - interpretare abstracta simplifica programul prin definirea unei semantici care considera doar aspectele relevante pentru proprietatea dorita - Sisteme de tipuri definind sistem corespunzator de tipuri, multe proprietati pot fi convertite la probleme de inferenta   verificare a tipurilor Analiza programelor Curs 1 Marius Minea Analiza programelor introducere 15 Tehnici cu originea in domeniul compilatoarelor - folosite pentru generarea de cod (alocarea de registri) - si optimizarea de cod (propagarea constantelor, factorizarea expresiilor comune, detectarea variabilelor nefolosite, etc ) Ulterior, unificateintr-un cadru general care permite aplicarea si la alte probleme de analiza de cod Abordarea de baza: - construirea grafului de flux de control al programului - urmarirea modului in care proprietatile de interes se modifica pe parcursul programului (la traversarea nodurilor   muchiilor grafului) Analiza programelor Curs 1 Marius Minea Analiza programelor introducere 16 Reprezentare in care: - nodurile sunt instructiuni - muchiile indica secventierea instructiunilor (inclusiv salturi) => putem avea: noduri cu: - un singur succesor (ex atribuiri), - mai multi succesori (instructiuni de ramificatie) - mai multi predecesori (reunirea dupa ramificatie) Obs : Alternativ, dar mai putin folosit: - nodurile sunt puncte din program (valori pentru PC) - muchiile sunt instructiuni cu efectele lor Analiza programelor Curs 1 Marius Minea Analiza programelor introducere 17 G = (N,E) : graful de flux de control (TV : noduri; E : muchii) s : o instructiune de program (nod in graful de flux de control) entry, exit : punctele de intrare si de iesire din program in(s') : multimea muchiilor care au s ca destinatie out(s) : multimea muchiilor care au s ca sursa src(e), c est(e) : instructiunea sursa si destinatie a muchiei e pred(s) : multimea predecesorilor instructiunii s succ(s) : multimea predecesorilor instructiunii s Cu aceste notiuni scriem ce descriu cum se modifica valorile analizate (dataflow facts) de la o instructiune la alta Notam cu indicii jn si out valoarea analizata la intrarea si respectiv iesirea din instructiunea s Analiza programelor Curs 1 Marius Minea Analiza programelor introducere 18 Care sunt toate atribuirile (definitiile) care pot atinge punctul curent (inainte ca valorile atribuite sa fie suprascrise) ? Elementele de interes sunt perechi: (variabila, linie de definitie) Pentru fiecare instructiune (identificata cu eticheta ei Z) ne intereseaza valoarea dinainte RDj^s) si de dupa RDou^s) - nodul initial din graf nu e atins de nici o definitie: RDout{entry) = {(v,?) | v e V} - o atribuire l : v sensul analizei e inapoi Operatia de combinare (meet): LVeout(s) = 0 Us'(=SL CC(s) bV efn(s') daca succ{s) = 0 altfel => combinarea facuta prin uniune {may, pe cel putin o cale) Calculul: algoritm de tip worklist care face modificari pornind de la valorile initiale pana nu mai apar schimbari => se atinge un Analiza programelor Curs 1 Marius Minea Analiza programelor introducere 20 in fiecare punct de program, care sunt expresiile a caror valoare a fost calculata anterior, fara sa se modificat, pe toate caile spre acel punct? (daca valoarea se tine minte intr-un registru, nu trebuie recalculata) Functia de transfer: A ?out(s) = (A ? n(s)   {e | V(e) П write(s) 0}) U{e G Subexp{s) | V(e) П write(s) = 0} (expresiile de la intrarea in s care nu au variabile modificate de s, si orice expresii calculate in s fara a li se modifica variabilele) Operatia de combinare (meet): 0 XE^(,s) — daca precis) = 0 altfel => combinarea e facuta prin intersectie {must, pe toate caile); analiza e inainte Analiza programelor Curs 1 Marius Minea Analiza programelor introducere 21 Care sunt expresiile care trebuie evaluate pe orice cale din punctul curent inainte ca valoarea vreunei variabile din ele sa se modifice ? => evaluarea se poate muta in punctul curent, inainte de ramificatii - o analiza inapoi, si de tip universal {must) VBEin{s) = (VBEout(s)   {e | V(e) П write(s) ф 0}) U Subexp{s) VBEout(s) — 0 daca succ(s) = 0 As'esucc(s) VBEin(s') altfel Analiza programelor Curs 1 Marius Minea Marius Minea marius@cs upt ro http:  cs upt ro  marius curs lsd  26 septembrie 2016 Matematici discrete folosind Bazele informaticii notiunile de baza din stiinta calculatoarelor unde si cum se , mai ales in => cum sa : modulul de baza pentru calcule : apar in grafuri, retele (sociale), calcul paralel, : prelucrarea de colectii de obiecte : cum sa definim simplu prelucrari complexe si sa rezolvam probleme prin subprobleme mai mici Fractalul lui Koch cum exprimam afirmatii pentru definitii riguroase, specificatii in software, cum afirmatii pentru a arata ca un algoritm e corect cum formule logice pentru a gasi solutii la probleme (ex programare logica) a, b : sisteme cu logica de control simpla b a b : prelucrari simple de text (a|b)*aba(a|b)* : sintaxa limbajelor de programare ifStmt ::= if ( Expr ) Stmt else Stmt : prelucrari de expresii numerice : vizualizarea relatiilor Assodation for , Ung Madiinery Advandng Computing as a Science & Profession 4HEEE " iEEE ©computer society http:  www acm org education curricula-recommendations Knowledge Area CS2013 CS2008 Core CC2001 Core Tierl Tier2 AL-Algorithms and Complexity 19 9 31 31 AR-Architecture and Organization 0 16 36 36 CN-Computational Science 1 0 0 0 DS-Discrete Structures 37 4 43 43 (i '-( iraphics and Visualizalmn 2 1 3 3 1 К ’ l-l luman-( ’omputer interaction 4 4 8 8 lAS-information Assurance and Security 3 6 - - iM-information Management 1 9 11 10 iS-intelligent Systems 0 10 10 10 NC-Networking and Communication 3 7 15 15 OS-Operating Systems 4 11 18 18 PBD-Platform-based Development 0 0 - - PD-Parallel and Distributed Computing 5 10 - - PL-Programming Languages 8 20 21 21 SDF-Software Development Fundamentals 43 0 47 38 SE-Software Engineering 6 22 31 31 SF-Systems Fundamentals 18 9 - - SP-Social issues and Professional Practice 11 5 16 16 Total Core Hours 165 143 290 280 project: 1 2+1 2 advanced: 2 lab: 1 header: 3 foundational: 3 introductory: 2 math: 2 18 03 06 + 6 042 iffi iffli BROWN UNiVERSiTY OF CAMBRiDGE HARVARD UNiVERSiTY 6S a Fiind date multimile si , o face sa corespunda element din A e o asociere care element din B imagine: http :  en wikipedia org wiki File: Total function svg Definitia functiei are deci componente: № asocierea corespondenta propriu-zisa (legea, regula) f : Z —> Z, f(x) = x + 1 si sunt functii distincte! f : R R, f(x) = x + 1 in limbajele de programare, domeniul de definitie si de valori corespund Putem avea functii care lucreaza cu mai multe tipuri ( nu asociaza o valoare fiecarui element asociaza mai multe valori unui element imagine: http:  en wikipedia org wiki File:Partial function svghttp:  en wikipedia org wiki File:Multivalued function svg in limbajele de programare, o functie exprima un primeste o valoare (argumentul) si produce ca rezultat alta valoare iNPUTx FUNCTiON f: OUTPUT f(x) imagine: http:  en wikipedia org wiki File :Function machine2 svg in limbajele de programare, (procedura, metoda) e notiunea de baza prin care descriem o prelucrare (un calcul) Aceasta se vede cel mai clar in lucram cu functii la fel de simplu ca si cu alte valori uzuale (intregi, reali, etc ) scriem prelucrari complexe prin compunere de functii simple (impartind programul in functii controlam complexitatea) ML: dezvoltat (Robin Milner, Univ Edinburgh, anii ’70) impreuna cu un sistem de demonstrare de teoreme (logica matematica) ilustreaza bine conceptele de matematici discrete (liste, multimi) (in cateva linii de cod se pot face multe) => evita anumite erori (ex de ) conceptele din programarea functionala au influentat alte limbaje (JavaScript, lambda-expresii in C# si Java 8, Python, Scala ) Ѵф (platforma NET) e foarte similar cu ML E important sa invatam , nu doar limbaje! "A language that doesn't afFect the way you think about programming, is not worth knowing " A lan Perlis Caml: un dialect de ML, cu interpretorul si compilatorul OCarnl http:  ocaml org x -> X + 1 о reprezentand о functie (fara nume x -> X + 1 (numele) f de expresia data se scrie mai scurt: x = x + 1 interpretorul OCarnl raspunde: val f : int -> int = matematic: f e o functie de la intregi la intregi => in program: f e o functie cu argument de intreg (int) si rezultat de intreg (domeniul si codomeniul devin ) in programare, un de date e o multime de valori, impreuna cu niste operatii definite pe astfel de valori in ML, tipurile pot fi deduse ( ): pentru ca la x se aplica +, compilatorul deduce ca x e intreg : cel mai simplu limbaj de programare (Church 1932) Universal: poate exprima orice functie calculabila (orice poate fi calculat printr-un program) 0 expresie in A-calcul e: o o Ax e functie de variabila x cu expresia e in ML: fun x -> e o de functie ei e? functia ei aplicata argumentului 62 la fel in ML: (fun x -> x+1) 3 asociativa la stanga: f x у = (f x) у lambda-calculul e fundamental in studiul limbajelor de programare O functie matematica, apelata repetat (cu da rezultat argument), E adevarat si in programarea functionala vom programa cat mai mult in acest fel e mai usor de rationat despre programele scrise in programarea imperativa nu e intotdeauna asa (atribuiri la variabile) printr-o singura formula (expresie regula) pe cazuri (mai multe variante expresii, depinzand de o conditie) individual (explicit) pentru fiecare valoare Valoarea functiei nu e data de o singura expresie, ci de una din doua expresii diferite (x sau -x), depinzand de o conditie (x > 0) x = x>=0 x -x if expri then expr^ else ехргз e o Daca lui expri da valoarea adevarat ( ) valoarea expresiei e valoarea lui expr?, altfel e valoarea lui ехргз expr? si ехргз trebuie sa aibe (ambele intregi, reale, ) in alte limbaje (C, Java, etc ) if si ramurile lui sunt in ML, if e o in ML nu avem instructiuni, ci doar (care sunt evaluate), si de valori sau functii (cu ) (Vom lucra ulterior si cu definitii de tipuri si de module ) Exemplu: conversie note americane i ’A’ -> 4 i ’B’ -> 3 i ’C’ -> 2 i ’D’ -> 1 i -> 0 Cuvantul cheie introduce o functie definita folosind (engl pattern matching) Fiecare varianta are forma tipar -> rezultat in cazul de mai sus, fiecare tipar e o valoare individuala (caracter) Tiparul acopera orice valoare (care nu a fost deja acoperita) Limbajul ne sa acoperim toate variantele (o functie trebuie sa fie definita complet) reduce numarul de erori Def : O functie f : A —> В e la argumente (valori) diferite daca asociaza valori diferite Riguros: pentru orice xi,%2 G A, *i 7^ *2 => f(xi) Ф ^(*2) Echivalent: f(xi) = ^(*2) xi = x2 daca valorile sunt egale, atunci argumentele sunt egale ( afirmatiei de mai sus) in logica, faptul ca o afirmatie e echivalenta cu contra pozitiva ei ne permite Daca multimile A si В sunt finite, si f e injectiva, atunci |Д| 1 putem construi f sa duca doua elemente din Дт aceeasi valoare din B) imagine: http:  en wikipedia org wiki File: injection svg http:  en wikipedia org wiki File:Surjection svg O functie f : А —> В е un х G А cu f(x) = у daca pentru fiecare у G В exista imagine: http :  en wikipedia org wiki File:Surjection svg imagine: http:  en wikipedia org wiki File:injection svg Daca A si В sunt finite si f : A —> В e surjectiva, atunci |A| >  B  Nu neaparat invers! (construim f sa nu ia ca valoare un element anume din B, daca  B  > 1) Putem transforma o functie ne-surjectiva intr-una surjectiva prin restrangerea domeniului de valori: fi : R —> R, fi(x) = x2 nu e surjectiva, dar f> : R —> [0, oo) (restransa la valori nenegative) este in programare, e util sa definim functia cu tipul rezultatului cat mai precis (daca e posibil, surjectiva) Astfel, cand rationam despre program, stim deja din tipul functiei ce valori poate returna, fara a trebui sa-i analizam codul Exercitiu: cum putem defini functia semn ? Daca A si В sunt multimi finite exista | B ІДІ functii de la A la B Notatie: |Д| = cardinalul lui A (numarul de elemente) Demonstratie: prin dupa |Д| Daca o propozitie P(n) depinde de un numar natural n, si 1) ( ) P(0) e adevarata 2) ( ) pentru orice n > 0, P(n) => P(n + 1) atunci P(n) e adevarata pentru orice n O functie care e injectiva si surjectiva se numeste O functie bijectiva f : A —> В pune in corespondenta elementele lui A cu cele ale lui B Pentru functie, din definitie, la fiecare x G A corespunde un unic у G В cu f(x) = у Pentru o functie , si invers: la fiecare у € В corespunde un unic x G A cu f(x) = у Daca multimile A si В sunt finite, si f e bijectiva, atunci |Д| =   B  imagine: http:  en wikipedia org wiki File:Bijection svg Fie functiile f   A —> В s'  g В —> C Compunerea lor este functia g o f : A C, (g O f)(x) = g(f(x)) Compunerea ne permite sa construim functii mai complicate din functii mai simple imagine: http:  en wikipedia org wiki File:Compufun svg iNPUT x=3 Rezultatul functiei f devine argument pentru functia g OUTPUT g(f(x))=10 imagine: http:  en wikipedia org wiki File:Function machine2 svg Compunerea a doua functii e asociativa: (f o g) o h = f O (g O  7) Compunerea a doua functii nu e neaparat comutativa f ° g g ° f (in general) Pe orice multime A definim ісід : A —> A,   В e inversabila daca exista o functie : В —> A astfel incat o f = id& si f o = ісів- 0 functie e inversabila daca si numai daca e Demonstram: Daca f e inversabila: pentru у G В oarecare, fie x = f 1(y) Atunci f(x) = fr(fr 1(y)) = y, deci f e surjectiva daca f(xi) = f(хг), atunci f 1(f(xi)) = f 1(f(x2)), deci хі=хг , daca f e bijectiva: - f e surjectiva => pentru orice у € В x G A cu f(x) = у - f fiind injectiva, daca exista хі,хг cu f(xi) = у = ^(хг), atunci xi = x2 Deci : В —> A, f 1(y) = acel x astfel incat f(x) = у e o functie bine definita, f 1(f(x)) = x, si  г( г 1(у)) = у,- Fie f : A -+ B Daca S C A, multimea elementelor f(x) cu x G S se numeste lui S prin f, notata f(S) Daca T CB, multimea elementelor x cu f(x) G T se numeste lui T prin f, notata in general, f 1(f(S)) D S (aplicand intai functia, si apoi revenind la preimagine, se pierde precizie) Pentru o functie inversabila, inversa nu e neaparat Fie multimea Z* a resturilor nenule modulo p, cu p prim Ea formeaza un cu operatia de inmultire mod p Teorema lui Fermat: ap 1 = 1 mod p pentru orice a E Z* Se mai stie ca daca p e prim, grupul Z* are cel putin un adica un element g astfel incat sirul g,g2,g3, ,gp 1 parcurge toata multimea Z* De exemplu, 3 e generator in Z7*: sirul 3k mod 7 e 3, 2,6,4,5,1 inseamna ca functia f : Z* —> Z*, f(x) = gx mod p e o (si inversabila) Nu se cunoaste insa un mod eficient de a o inversa cand p e mare (problema logaritmului discret) => e folosita in criptografie Cand scriem f (x, y) = in ML, f nu are doua argumente, ci argument, (x, y) Daca x G A si у G B, f e definita pe A x B  f- AxB —> C (x, у) = 2*x + у - 1 si interpretorul raspunde val fl : int * int -> int = (tipul lui f 1 e functie de o pereche de intregi cu valoare intreaga) Alternativ, putem defini x у = 2*x + у - 1 si interpretorul raspunde val f2 : int -> int -> int = f2 e de fapt o functie cu argument x, care returneaza o Aceasta ia argumentul у si returneaza rezultatul numeric in programarea functionala se prefera scrierea in acest mod (numit , dupa Haskell Curry) permite evaluarea partiala a functiei, avand primul argument Multimea functiilor f : A —> В se noteaza uneori BA Notatia ne aminteste ca numarul acestor functii e |B ІДІ (daca А, В sunt finite) Numarul functiilor f : А x В —> C este |Cp'4*6' = |Cp'4l'leL Rescriind prin currying (f a b in loc de f (a, b) in ML) obtinem multimea functiilor f : A —> CB (functii care cu un argument din A produc o functie de la В la C, adica din Ce) Numarul acestora e tot (|СреІ)ІдІ = |Cp'4l'leL Aceasta ne indica faptul ca exista o corespondenta 1:1 (bijectie) intre scrierea cu un argument pereche si scrierea cu 2 argumente Operatorii (ex matematici, +, *, etc ) sunt tot niste functii: ei calculeaza un rezultat din valorile operanzilor (argumentelor) Diferenta e doar de : scriem operatorii intre operanzi ( ), iar numele functiei inaintea argumentelor ( ) Putem scrie in ML operatorii si prefix: (+) 3 4 paranteza deosebeste de operatorul + unar = (+) 1 addl 3 la fel ca: (+) 1 3 addl e functia care adauga 1 la argument, deci x -> x + 1 Prin functii exprimam calcule in programare Operatorii sunt cazuri particulare de functii Domeniile de definitie si valori corespund din programare Cand scriem compunem functii, tipurile trebuie sa se potriveasca, in limbajele functionale, functiile pot fi manipulate ca orice valori Functiile pot fi argumente si rezultate de functii Functiile de mai multe argumente (sau de tuple) pot fi rescrise ca functii de un singur argument care returneaza functii Sa despre functii injective, surjective, bijective, inversa bile Sa functii cu anumite proprietati Sa functiile definite pe multimi finite (cu proprietati date) Sa functii simple pentru a rezolva probleme Sa identificam unei functii Marius Minea 3 octombrie 2011 - limbajul are regulile lui - rezolvam probleme (noi) - si in laborator dezvoltat in 1972 la de Dennis Ritchie asociat cu sistemul de operare UNiX si utilitarele acestuia (C dezvoltat initial sub UNiX, apoi UNiX a fost rescrisin C) Brian Kernighan, Dennis Ritchie: (1978) Limbaj vechi, dar in evolutie standardul ANSi C, 1988 (American National Standards institute) versiunea curenta: C99 (standard iSO 9899) : acces direct la reprezentarea binara a datelor, libertate in lucrul cu memoria, buna interfata cu hardware , baza mare de cod (biblioteci pentru multe scopuri) : compilatoare bune, genereaza cod compact, rapid : foarte usor de facut i date de intrare le prin calcule (matematice) (scrie) niste rezultate in matematica, exprimam calculele prin functii predefinite (sin, cos, etc ) functii noi (pentru problema data) functiile existente si definite de noi le intr-o anumita ordine La fel folosim functiile in programare Ridicarea la patrat pentru intregi: sqr : Z Z sqr(x) = x   x tipul numele tipul si numele functiei functiei parametrului int sqr(int x) return x * x; } unei functii contine: functiei, care specifica: domeniul de valori (intregi), numele functiei (sqr) si parametrii acesteia (intregul x) functiei: aici, o singura (return), cu o care da valoarea functiei (pornind de la parametri) Limbajul are precise de scriere ( ): elementele se scriu intr-o anumita ; se folosesc pentru a le delimita precis: ( ) ; { } Ridicarea la patrat pentru numere reale sqrf : iR iR float sqrf(float x) sqrf(x) = x   x return x * x; } Alt domeniu de definitie si de valori (reali) alta functie (chiar si operatia * e alta, fiind definita pe alta multime) Pentru a o deosebi in program de sqr trebuie sa-i dam alt nume Cuvintele int, float denota Un e o impreuna cu un permise pentru aceste valori Pentru reali, e preferabil tipul (dubla precizie) (folosit si de functiile standard: sin, cos, exp, etc ) Tipurile numerice difera intre C si matematica in matematica, ZT C iR, ambele sunt infinite, iR e densa in C, int, float, double sunt tipuri finite; realii au precizie finita numerice au tip determinat de modul de scriere: 2 e un intreg, 2 0 e un real putem scrie un real in notatie stiintifica: 1 Oe-3 in loc de 0 001 sunt echivalente scrierile 1 0 si 1 respectiv 0 1 si 1 + *   inmultirea trebuie scrisa explicit! nu putem scrie 2x, ci 2 * x (sau x * 2) Unele operatii sunt diferite pentru intregi si reali: e !!! 7   2 da valoarea 3, dar 7 0   2 0 da valoarea 3 5 -7   2 da valoarea -3, la fel cu -(7   2) Operatorul 9   5 = 1 -9   5 = -1 (scris 7 ) e definit doar pentru intregi 9 % 5 = 4 9   -5 = -1 9 % -5 = 4 -9 % 5 = -4 -9   -5 = 1 -9 % -5 = -4 Semnul restului e acelasi cu semnul deimpartitului Ecuatia impartirii cu rest: a = a  b*b + a% b : au un inteles predefinit (nu poate fi schimbat) Exemple: instructiuni (return), tipuri (int, float, double), etc (de ex sqr, x) alesi de programator pentru a denumi functii, parametri, variabile, etc Un identificator e o secventa de caractere formata din litere (mari si mici), liniuta de subliniere si cifre, care nu incepe cu o cifra si nu este un cuvant cheie Exemple: x3, al2 34, exit, main, printf, intl6 t (intreg: -2; real: 3 14; caracter: ’a’, sir: "a") , cu diverse semnificatii: * e un operator ; delimiteaza sfarsitul unei instructiuni parantezele ( ) grupeaza parametrii functiei sau o subexpresie acoladele { } grupeaza instructiuni sau declaratii Exemplu: discriminantul ecuatiei de gradul ii: a-x2 + b- x + c = 0 float discrim(float a, float b, float c) return b*b-4*a*c; intre parantezele rotunde ( ) din antetul functiei putem specifica oricati parametri, fiecare cu tipul propriu, separati prin virgula Pana acum, am functii, fara sa le folosim Valoarea unei functii poate fi intr-o expresie Sintaxa: ca in matematica: functie(param, param,      , param Exemplu: in discriminant, puteam folosi functia sqrf: return sqrf(b) - 4 * a * c; Sau, folosind functia sqr dinainte putem defini: int cube(int x) return x * sqr(x); } iMPORTANT: inainte de a folosi orice identificator (nume) in C, el trebuie sa fie (trebuie sa stim ce reprezinta) => Exemplele sunt corecte daca sqrf respectiv sqr sunt definite inainte de discrim, respectiv cube in program int main(void) { return 0; } Cel mai mic program: nu face nimic 1 Orice program contine functia si e executat prin apelarea ei (programul poate contine si alte functii) in acest caz: functia nu are parametri ( ) void e un cuvant cheie pentru tipul vid (fara nici un element) in standard: main returneaza sistemului de operare un cod intreg (conventie: 0 pt terminare cu succes, 0 pt cod de eroare)  * Acesta este un comentariu *  int main(void)    comentariu pana la capat de linie  * Acesta e un comentariu pe mai multe linii obisnuit, aici vine codul programului *  return 0; } Programele pot contine comentarii, inscrise intre  * si *  sau incepand cu    si terminandu-se la capatul liniei Orice continut intre aceste caractere nu are nici un efect asupra generarii codului si executiei programului Programele comentate pentru ca un cititor sa le inteleaga (altii, sau noi, mai tarziu) ca documentatie si specificatie: functionalitate, restrictii, etc ce reprezinta parametrii functiilor, rezultatul, variabilele, ce conditii trebuie indeplinite, cum se comporta la eroare #include int main(void) { printf("hello, world! n");    tipareste un text return 0; printf (de la "print formatted"): o functie standard nu este instructiune sau cuvant cheie e apelata aici cu un parametru sir de caractere constantele sir de caractere: incluse intre ghilimele " "  n este notatia pentru caracterul de linie noua Prima linie e o , include fisierul stdio h cu functiilor standard de intrare   iesire = tip, nume, parametri: necesare pentru folosire (codul obiect, compilat): intr-o biblioteca din care compilatorul ia cele necesare la generarea programului executabil #include #include int main(void) printf("cos(O) = "); printf ("70f", cos(O)); return 0; #include int sqr (int x) { return x * x; int main(void) printf("2 ori -3 la patrat e " printf("7,d", 2 * sqr(-3)); return 0; Pentru a tipari valoarea unei expresii, printf ia doua argumente: - un sir de caractere (specificator de format): %d (intreg, decimal), %f (real, floating point) - expresia, al carei tip trebuie sa fie compatibil cu cel indicat (verificarea cade in sarcina programatorului ii!) : instructiunile unei functii se executa una dupa alta Exceptii: instructiunea return incheie executia functiei (dupa ea nu se mai executa nimic) abs : Z —> Z x > O altfel Cu cele invatate pana acum, nu putem defini aceasta functie in C Valoarea functiei nu e data de o singura expresie, ci de una din doua expresii diferite (x sau -x), depinzand de o conditie (x > 0) => in limbaj, trebuie sa putem valoarea luata de expresie in functie de valoarea unei (adevarat fals) in C are sintaxa: conditie ? exprl : expr2 - daca conditia e adevarata, se evalueaza doar exprl, si intreaga expresie ia valoarea acesteia - daca e falsa, se evalueaza doar expr2 si intreaga expresie ia valoarea acesteia int abs(int x) return x >= 0 ? x : -x;    operator minus unar } Operatorii de comparatie: == (egalitate), != (diferit), , >= iMPORTANT! Testul de egalitate in C e == si nu = simplu ii! Functia abs exista ca functie standard, declarata in stdlib h 1Т 1Т [ -1 X {—1, 0,1} sgn(x) = О Nu putem transcrie functia direct in C (operatorul conditional permite doar decizia cu ramuri (adevarat fals), nu cu mai multe conditii   ramuri) trebuie sa descompunem decizia asupra valorii lui x mai mici: principiu foarte im porta nt' n rezolvarea de probleme Rescriem functia cu o singura decizie in fiecare punct: daca x 0) -1 ( daca x = 0 0 ( altfel (x > 0) 1 (daca x 0) -1 ( daca x = O O [ altfel (x > 0) 1 int sgn (int x) return x z) z 1 ur i x i Г daca у z) z Se repeta structura functiei min2 => putem gandi mai simplu: Rezultatul e minimul intre minimul primelor doua si al treilea, folosim direct functia dinainte pe cazuri double min3(double x, double y, double z) { return min2(min2(x, y), z);    sau min2(x, min2(y,z)) Programul dat calculeaza x6 = (x x2)2 #include int sqr(int x) { printf("Patratul lui %d e %d n", x, x*x); return x * x; int main(void) { printf("2 la a 6-a e %d n", sqr(2 * sqr(2))); return 0; in ce ordine se scrie pe ecran ? Patratul lui 2 e 4 Patratul lui 8 e 64 2 la a 6-a e 64 in C, transmiterea parametrilor la functii se face se (calculeaza valoarea) toate argumentele functiei valorile se atribuie la (numele din def fct ) apoi se incepe executia functiei cu aceste valori Programul incepe cu executia lui main, deci apelul la printf Functia printf are nevoie de valoarea argumentelor sale valoarea primului argument se stie (o ) pentru al doilea argument trebuie apelat: sqr (2 * sqr (2)) la randul lui, sqr exterior are nevoie de valoarea argumentului 2 * sqr (2), pentru care trebuie apelat intai sqr (2) ordinea apelurilor: sqr(2), apoi sqr(8), apoi printf din main Cum in C (desi ne-am putea inchipui ) Functia incepe executia fara sa aiba argumentele calculate printf ar tipari 2 la puterea 6 e , apoi ii trebuie valoarea ar apela sqr exterior care scrie Patratul lui, apoi ii trebuie x ar apela sqr (2) care scrie Patratul lui 2 e 4, returneaza 4, etc se substituie argument pentru parametrii functiei din printf s-ar apela sqr exterior cu 2 * sqr (2) pentru (2*sqr(2))*(2*sqr(2)) s-ar apela sqr(2) de doua ori => in C, o functie calculeaza numai cu , niciodata cu Din matematica cunoastem progresie aritmetica: ( xq = b (adica: xn = b pentru n = 0) ( xn = xn i + r pentru n > 0 Exemplu: 1,4, 7,10,13, (b = 1, r = 3) progresie geometrica: xq = b (adica: xn = b pentru n = 0) xn = xn i   r pentru n > 0 Exemplu: 3, 6,12, 24,48, (b = 3, r = 2) Nu calculeaza xn direct, ci , folosind xn i O notiune e daca e Alte exemple: combinari C", sirul lui Fibonacci, Exercitiu: scrieti relatiile! Recursivitatea e fundamentala in informatica: reduce o problema la un caz mai simplu al probleme {un singur element Q sir ,—л—, un element urmat de un ООО O ex cuvant (sir de litere); numar (sir de cifre zecimale) : un e un pas —> drum un urmat de un pas '—> ex parcurgerea unei cai intr-un graf O "numar (7) identificator (x) 0) #include double pwr(double x, unsigned n) { return n==0 ? 1 : x * pwr(x, n-1); } int main(void) { printf("-2 la 3 = %f n", pwr(-2 0, 3)); return 0; } Tipul reprezinta intregi fara semn (numere naturale) pwr reprezinta o a ei deci putem folosi functia in propriul corp (apelul recursiv) Chiar daca scriem pwr (-2, 3), -2 va fi (se cunoaste tipul declarat pentru fiecare parametru) Functia pwr face doua calcule: -un (n == 0 ? ?) daca da, returneaza 1 - altfel, o ; operandul drept necesita un pwr(5, 3) И125 5* pwr(5, 2) И25 5* pwr (5, 1) ;i5 5 * pwr(5, 0) 1 in calculul recursiv al functiei putere: Fiecare apel face "in cascada" , pana la cazul de baza Fiecare apel executa , dar cu (valori proprii pentru parametri) Ajunsi la cazul de baza, toate apelurile incepute sunt inca (fiecare mai are de facut inmultirea cu rezultatul apelului efectuat) Revenirea se face apelarii (apelul cu exponent 0 revine primul, apoi cel cu exponent 1, etc ) 1 ( necesita apel recursiv) = cel mai simplu caz pentru definitia (notiunea) data, definit direct termenul initial dintr-un sir recurent: xq un element, in definitia: sir = element sau sir + element E o daca lipseste cazul de baza (apel recursiv infinit!) 2 propriu-zisa -defineste notiunea, folosind un caz mai simplu al aceleiasi notiuni 3 Demonstratie de dupa numar finit de pasi (ex o marime nenegativa care descreste cand aplicam definitia) - la siruri recurente: indicele (> 0 dar mai mic in corpul definitiei) - la obiecte: dimensiunea (definim obiectul prin alt obiect mai mic) ? xn+1 = 2   xn ? xn = xn | i 3 ? an = a   a     a (de n ori) ? o fraza e o insiruire de cuvinte ? un sir e un sir mai mic urmat de un alt sir mai mic ? un sir e un caracter urmat de un sir 0 definitie recursiva trebuie sa fie bine formata (v conditiile 1-3) ceva nu se poate defini doar in functie de sine insusi se pot utiliza doar notiuni deja definite nu se poate genera un calcul infinit (trebuie sa se opreasca) unsigned fact 1(unsigned n) { return n == O ? 1 : n * factl(n-l); } Corespunde scrierii: 5! = 5   (4   (3   (2   (1   1)))) Calcule: 1*1 (1), 2*1 (2), 3*2 (6), 4*6 (24), 5*24 (120), etc Calculul: facut la sfarsitul functiei, revenirea din apelul recursiv E nevoie de loc in pentru toate apelurile in curs (parametri, variabile locale, adresa de revenire, registri salvati) => ineficient, necesita mult loc pe stiva Reordonam inmultirile: 5! = ((((   5)   4)   3)   2)   1 apel recursiv cu un (acumulator) ca in cazul de baza (n = 0), , il returnam res: 1, 5 (1*5), 20 (5*4), 60 (20*3), 120 (60*2), 120 (120*1) unsigned fact2(unsigned res, unsigned n) return n == 0 ? res : fact2(res*n, n-1); } Functia auxiliara scrisa calculeaza res-n! => luam res=l unsigned fact(unsigned n) { return fact2(l, n); } factl(3) И6 3* f actl (2) И2 2* factl(l) 1 * fact2(l, 3) t t6 fact2(3, 2) t t6 fact2(6, 1) t t6 ictl(O) fact2(6, 0) ttl t t6 1 6 calcul: 3 • (2 • (1 • 1)) calcul: (((1 • 3) • 2) • 1) Apelul: in calculul rezultatului; inmultirea: dupa revenire Calculul: inainte de apel, actualizand rezult, partial transmis ca argument Revenire: returneaza direct valoarea , recursivitate cu revenire in cazul 2 (tail-recursive)' nici un calcul la revenire => nu necesitainregistrarea de apel (adresa, parametri) pe stiva => compilatorul Calculul sumei intregilor intre a si b: a + (a + 1) + + (b - 1) + b Cazul de baza: a > b, intervalul [a, b] e vid => suma e 0 Pasul recursiv: suma e primul numar, plus suma intervalului ramas (sau: ultimul numar, plus suma intervalului dinainte) sum all(a b) = a + sum all(a + 1, b) (daca a > b) int sum all(int a, int b) return a > b ? 0 : a + sum all(a+l, b); Sau, rescriind cu un parametru suplimentar care acumuleaza suma: int sum acc(int a, int b, int r) return a > b ? r : a + sum all(a+l, b, r+a); int sum a!12(int a, int b) { return sum acc(a, b, 0); } cmmdc(a, Ь) = а cmmdc(a — b, b) cmmdc(a, b — a) a = b a > b a b ? cmmdc(a-b, b) : cmmdc(a, b-a); int main(void) { printf("cmmdc(20, 8) e 70u n",    ° ou = unsigned cmmdc(20, 8)); return 0; Calculul e corect doar cu a si b nenule Pentru a trata si cazul zero: return a == 0 ? b : b == 0 ? a : a > b ? cmmdc(a-b, b) : cmmdc(a, b-a); Marius Minea marius@cs upt ro http:  www cs upt ro  marius curs f i 30 septembrie 2011 Functii recursive Un limbaj functional: ML functii ca obiecte fundamentale (parametri, rezultate) Complexitatea calculului - un prim exemplu Structuri de date recursive: liste Din matematica cunoastem progresie aritmetica: 0 (adica: xn = b pentru n = 0) pentru n > 0 , folosind xn-i Din matematica cunoastem progresie aritmetica: 0 progresie geometrica: ( xq = b (adica: xn = b pentru n = 0) ( xn = xn-i   r pentru n > 0 => nu calculeaza xn direct, ci , folosind xn i Un obiect (notiune) e recursiv(a) daca e Alte exemple: combinari C", sirul lui Fibonacci, (scrieti relatiile!) Recursivitatea e fundamentala in informatica: reduce o problema la un caz mai simplu al probleme {un singur element Q sir un element urmat de un ООО O ex cuvant (sir de litere); numar (sir de cifre zecimale) Recursivitatea e fundamentala in informatica: reduce o problema la un caz mai simplu al probleme | un singur element Q sir : un e drum : un ( un urmat de un pas —>—>—> ex parcurgerea unei cai intr-un graf Recursivitatea e fundamentala in informatica: reduce o problema la un caz mai simplu al probleme ex | un singur element Q sir : un e drum : un e —>—> —> parcurgerea unei cai intr-un graf 0 : numar (7), sau identificator (x), sau expresie + expresie, sau expresie - expresie, sau ( expresie Un limbaj = functia e elementul de baza functiile pot fi parametri, rezultate, stocate combinand functii simple —> programe complexe Compilatorul deduce automat majoritatea din declaratii verificari stricte de tip => mai putine erori in program tipuri si functii (ex liste de orice tip) Poate fi sau (executa pe rand fragmentele de program introduse) ML are diverse variante de limbaj; folosim si sistemul http:  caml inria fr  3 + 4 ; ; - : int = 7 (* calculeaza valoarea unei expresii *) (* interpretorul afiseaza valoarea si ei *) Un de date e o multime de , impreuna cu un set de posibile pe aceste valori Tipuri de baza in ML: bool, char, float, int, string Exemplu: in ML, + e operator pe intregi, dar + e operator pentru reali let x = 3 ; ; (* declaratie *) val x : int = 3 (* raspuns: interpretorul deduce ca x e intreg *) identificatorul (variabila) x si il de expresia 3 (engl ) NU este o atribuire (x nu poate fi modificat ulterior let f x = x + 1 ;; interpretorul deduce (* defineste functia f de argument x *) lui f: functie de la intregi la intregi val f: int -> int = Rezultatul se obtine prin functiei f cu argumentul 4 *) - : int = 5 x + 1 f 4 ; ; (* apelul let abs x = if x 0) let rec pow x n = if n = O then 1 else x * (pow x (n-1)) val pow : int -> int -> int = let rec introduce o definitie (identificatorul definit, pow poate fi in interiorul definitiei) Remarcam ca functia e definita cu baza intreaga Pentru baza reala, inmultirea e * iar cazul de baza e 1 (sau 1 0) let rec powr x n = if n = 0 then 1 else x * (powr x (n-1)) #include double pwr(double x, unsigned n) { return n==0 ? 1 : x * pwr(x, n-1); } int main(void) { printf("-2 la 3 = %f n", pwr(-2 0, 3)); return 0; } Tipul reprezinta intregi fara semn (numere naturale) pwr reprezinta o a ei deci putem mai tarziu folosi functia in propriul corp (apelul recursiv Chiar daca scriem pwr (-2, 3), -2 va fi (se cunoaste tipul necesar pentru fiecare parametru) Functia pwr face doua calcule: -un (n == 0 ? a ajuns la ?) daca da, returneaza 1 - daca nu, o ; pt operandul drept trebuie un pwr(5, 3) И125 5* pwr(5, 2) И25 5* pwr (5, 1) ;i5 5 * pwr(5, 0) 1 in calculul recursiv al functiei putere: Fiecare apel face 7n cascada" , pana la cazul de baza Fiecare apel executa , dar cu (valori proprii pentru parametri) Ajunsi la cazul de baza, toate apelurile incepute sunt inca (fiecare mai are de facut inmultirea cu rezultatul apelului efectuat) Revenirea se face apelarii (apelul cu exponent 0 revine primul, apoi cel cu exponent 1, etc ) 1 ( necesita apel recursiv) = cel mai simplu caz pentru definitia (notiunea) data, definit direct termenul initial dintr-un sir recurent: xq un element, in definitia: sir = element sau sir + element E o daca lipseste cazul de baza (apel recursiv infinit!) 2 propriu-zisa - defineste notiunea, folosind un caz mai simplu al aceleiasi notiuni 3 Demonstratie de dupa numar finit de pasi (ex o marime nenegativa care descreste cand aplicam definitia) - la siruri recurente: indicele (nenegativ; mai mic in corpul definitiei) - la obiecte: dimensiunea (definim obiectul prin alt obiect mai mic) ? xn+1 = 2   xn ? xn = xn | i 3 ? an = a   a     a (de n ori) ? o fraza e o insiruire de cuvinte ? un sir e un sir mai mic urmat de un alt sir mai mic ? un sir e un caracter urmat de un sir 0 definitie recursiva trebuie sa fie bine formata (v conditiile 1-3) ceva nu se poate defini doar in functie de sine insusi NU: x = f( se pot utiliza doar notiuni deja definite nu se poate genera un calcul infinit (trebuie sa se opreasca) sirul lui Fibonacci: 2 Transcriind direct definitia: let rec fib n = if n 2 (apelul initial + cele recursive) Prin inductie putem arata: An = 2   Fn — 1, deci numarul de apeluri creste exponential i (sunt recalculate ineficient aceleasi valori) Exercitiu: scrieti o functie eficienta, tot recursiva, pentru Fn let rec factl n = (* in ML *) if n = O then 1 else n * factl (n-1) unsigned factl(unsigned n)    in C return n == O ? 1 : n * factl(n-l); } Corespunde scrierii: 5! = 5   (4   (3   (2   (1   1)))) Calcule succesive: 1*1 (1), 2*1 (2), 3*2 (6), 4*6 (24), 5*24 (120), etc Calculul (*) facut la sfarsitul functiei, revenirea din apelul recursiv E nevoie de loc in pentru toate apelurile in curs (parametri, eventuale variabile locale, adresa de revenire, registri salvati) => ineficient, necesita mult loc pe stiva Reordonam inmultirile: 5! = ((((   5)   4)   3)   2)   1 apel recursiv cu un (acumulator) ca in cazul de baza (n = 0), , il returnam valori res: 1, 5 (1*5), 20 (5*4), 60 (20*3), 120 (60*2), 120 (120*1) let rec fact2 res n = (* in ML *) if n = 0 then res else fact2 (res * n) (n-1);; unsigned fact2(unsigned res, unsigned n)    in C { return n == 0 ? res : fact2(res*n, n-1); } Functia auxiliara scrisa calculeaza res-n! => luam res=l unsigned fact(unsigned n) { return fact2(l, n); } let fact = fact2 1 (* are un parametru 1; mai cere unul fact2(l, 3) t t6 fact2(3, 2) t t6 fact2(6, 1) t t6 fact2(6, 0) t t6 6 (((1 • 3) - 2) • 1) f actl(3) И6 3* f actl (2) И2 2* factl(l) 1 * factl(0) ttl 1 calcul: 3 • (2 • (1 • 1)) calcul Apelul: in calculul rezultatului; inmultirea: dupa revenire Calculul: inainte de apel, actualizand rezultatul partial transmis ca argument La revenire: returneaza direct valoarea , recursivitate cu revenire in cazul 2 (tail-recursive): nici un calcul la revenire => nu e nevoie de inregistrarea de apel (adresa, parametri) pe stiva => compilatorul poate O lista е о insiruire ordonata de elemente de acelasi tip Definitie recursiva: lista vida (niciun element) sau un element urmat de Definitie recursiva =г prelucrarile de liste sunt natural recursive Tipul lista e predefinitin ML (parametrizat cu tip arbitrar de elemente) ex tipul unei liste de intregi e int list Lista vida (de orice tip): П Operatorul : : construieste o lista, dintr-un cap (element) si alta lista cap : : coada Valori de tip lista: intre П cu separator ; Listele se pot prelucra cu (pattern matching) pentru cele 2 cazuri: match lista with П -> exprl i cap :: coada -> expr2 Constructia de mai sus e o , cu rezultatul exprl daca lista e vida; altfel, identificatorii cap si coada sunt la cele doua parti ale listei, si pot fi folositi in expr2, a carei evaluare da rezultatul Marius Minea 26 februarie 2008 Programarea calculatoarelor Curs 1 Marius Minea Programarea calculatoarelor introducere 2 - dezvoltat si implementat in 1972 la АТ&Т Bell Laboratories de Dennis Ritchie http:  cm bell-labs coin cin cs who dinr chist htinl - nevoia unui limbaj pentru scrierea de sisteme de operare si utilitare (strans legat de dezvoltat la Bell Labs) - C dezvoltat initial sub UNiX; in 1973, UNiX rescris in totalitate in C - cartea de referinta: Brian Kernighan, Dennis Ritchie: (1978) - 1988 (K&R editia ii) limbajul a fost standardizat de ANSi (American National Standards institute) - versiunea numita ANSi C - versiunea curent: C99 (standard iSO 9899) - foarte versatil: acces la reprezentarea binara a datelor, mare libertate in lucrul cu memoria, buna interfata cu hardware - limbaj matur, baza mare de cod (biblioteci pt multe scopuri) - eficient: compilatoare bune, genereaza cod compact, rapid Programarea calculatoarelor Curs 1 Marius Minea Programarea calculatoarelor introducere 3 Primul rol al programelor: de a efectua (matematice) in matematica, efectuam calcule cu ajutorul : - diverse functii (sin, cos, etc ) - functii noi (depinzand de problema) - functiile existente si definite de noi - si le intr-o anumita ordine Toate aceste aspecte le intalnim si in programare Programarea calculatoarelor Curs 1 Marius Minea Programarea calculatoarelor introducere 4 Exemplu: functia de ridicare la patrat pentru intregi int sqr(int x) sqr : 'Z sqr(x) = x • x return x * x; unei functii contine: - functiei: specifica un domeniu de valori (intregi), functiei si parametrii acesteia (un singur parametru, intreg) — functiei: aici, o singura (return) cu o care da valoarea functiei (pornind de la parametri) numele Limbajul are precise de scriere ( ): - diversele elemente scrise intr-o anumita ; - se folosesc pentru a le delimita precis: ( ) Programarea calculatoarelor Curs 1 Marius Minea Programarea calculatoarelor introducere 5 Ridicarea la patrat pentru numere reale return x * x; - o alta functie decat cea dinainte: alt domeniu de definitie si de valori - trebuie sa-i dam alt nume daca o folosim in acelasi program - strict vorbind si operatia * e alta, fiind definita pe alta multime Cuvintele int, float denota Un e o pentru aceste valori impreuna cu un permise Programarea calculatoarelor Curs 1 Marius Minea Programarea calculatoarelor introducere 6 Exista diferente importante intre tipuri numerice in C si matematica, -in matematica, c iR, ambele sunt infinite, iR e densa — in C, int si float sunt tipuri finite; realii au precizie finita numerice au tip determinat de modul de scriere: 2 e un intreg, 2 0 e un real putem scrie un real in notatie stiintifica: 1 0e-3in loc de 0 001 sunt echivalente scrierile 1 0 si 1 respectiv o l si 1 - unele operatii sunt diferite pentru intregi si reali: e !!! 7   2 da valoarea 3, pe cand 7 0   2 0 da valoarea 3 5 -7   2 da valoarea -3, deci la fel cu - (7   2) Operatorul (scris ° 0) e definit doar pentru intregi 9 5 este 1 9 % 5 este 4 9   -5 este -1 9 ° 0 -5 este 4 -9 5 este -1 -9 % 5 este -4 -9   -5 este 1 -9 ° 0 -5 este -4 semnul restului e acelasi cu semnul deimpartitului e valabila egalitatea a == a   b * b + a ° 0 b (ecuatia impartirii cu rest) Programarea calculatoarelor Curs 1 Marius Minea Programarea calculatoarelor introducere 7 - : au un inteles predefinit (nu poate fi schimbat) exemple: instructiuni (return), tipuri (int, float), etc - (de ex sqr, x) alesi de programator pentru a denumi functii, parametri, variabile, etc Un identificator e o secventa de caractere formata din litere (mari si mici), liniuta de subliniere si cifre, care nu incepe cu o cifra si nu este un cuvant cheie Exemple: x3, al2 34, exit, main, printf, intl6 t - (numerice: -2, 3 14; mai tarziu: caractere, siruri) - , cu diverse semnificatii: * e un operator ; delimiteaza sfarsitul unei instructiuni parantezele ( ) grupeaza parametrii unei functii sau o subexpresie acoladele { } grupeaza instructiuni sau declaratii etc Programarea calculatoarelor Curs 1 Marius Minea Programarea calculatoarelor introducere 8 Exemplu: discriminantul ecuatiei de gradul ii: a • x2 + b • x + c = 0 float discrim(float a, float b, float c) return b*b-4*a*c; intre parantezele rotunde ( ) din antetul functiei putem specifica oricati parametri, fiecare cu tipul propriu, separati prin virgula Programarea calculatoarelor Curs 1 Marius Minea Programarea calculatoarelor introducere 9 Pana acum, am functii, fara sa le folosim Valoarea unei functii poate fi folosita intr-o expresie cu aceeasi sintaxa ca si in matematica: functie(parametru, parametru, parametru) Exemplu: in discriminantul dinaine, puteam scrie: return sqrf(b) - 4 * a * c; Sau putem defini: int cube(int x) return x * sqr(x); iMPORTANT: inainte de a folosi orice identificator (nume) in C, el trebuie sa fie (trebuie sa stim ce reprezinta) => Exemplele sunt corecte daca sqrf respectiv sqr sunt definite inainte de discrim, respectiv cube in program Programarea calculatoarelor Curs 1 Marius Minea Programarea calculatoarelor introducere 10 int main(void) return 0; - cel mai mic program: nu face nimic ! - orice program contine functia si e executat prin apelarea ei (programul poate contine si alte functii) -in acest caz: functia nu are parametri ( ) void e un cuvant cheie pentru tipul vid (fara nici un element) - cf standard: main returneaza un cod intreg catre sistemul de operare (conventie: 0 pt terminare cu succes, Ф 0 pt cod de eroare) Programarea calculatoarelor Curs 1 Marius Minea Programarea calculatoarelor introducere 11  * Acesta este un comentariu *  int main(void)    comentariu pana la capat de linie  * Acesta e un comentariu pe mai multe linii obisnuit, aici vine codul programului *  return 0; - programele pot contine comentarii, inscrise intre  * si *  sau incepand cu    si terminandu-se la capatul liniei - orice continut intre aceste caractere nu are nici un efect asupra generarii codului si executiei programului - programele comentate - pentru ca un cititor sa le inteleaga (altii, sau noi, mai tarziu) - ca documentatie si specificatie: functionalitate, restrictii, etc - ce reprezinta parametrii functiilor, rezultatul, variabilele, ce conditii trebuie indeplinite, cum se comporta la eroare Programarea calculatoarelor Curs 1 Marius Minea Programarea calculatoarelor introducere 12 #include int main(void) printf("hello, world! n");    tipareste un text return 0; - printf (de la "print formatted"): o functie standard (N B : printf nu este instructiune sau cuvant cheie) - e apelata aici cu un parametru sir de caractere - constantele sir de caractere: incluse intre ghilimele " " -  n este notatia pentru caracterul de linie noua - prima linie e o , include fisierul stdio h cu functiilor standard de intrare   iesire - = informatiile (nume, parametri) necesare pentru folosire - (codul obiect, compilat): intr-o biblioteca din care compilatorul ia cele necesare pentru generarea programului executabil Programarea calculatoarelor Curs 1 Marius Minea Programarea calculatoarelor introducere 13 #include #include #include int main(void) int sqr (int x) { return x * x; } int main(void) printf("cos(0) = "); printf ("° of ii > cos(0)); printf("2 ori -3 la patrat e "); printf ("° od" , 2 * sqr(-3)); return 0; return 0; Pentru a tipari valoarea unei expresii, printf ia doua argumente: - un sir de caractere (specificator de format): ° od (intreg, decimal), ° of (real, floating point) - expresia, al carei tip trebuie sa fie compatibil cu cel indicat (verificarea cade in sarcina programatorului !!!) : instructiunile unei functii se executa una dupa alta — exceptii: instructiunea return incheie executia functiei (dupa ea nu se mai executa nimic) Programarea calculatoarelor Curs 1 Marius Minea Programarea calculatoarelor introducere 14 abs : % —> , z x f x x > 0 abs(x) = 0 sau nu) => e necesara o facilitate de limbaj pentru a decide valoarea pe care o ia o expresie in functie de valoarea unei conditii (adevarat fals) Programarea calculatoarelor Curs 1 Marius Minea Programarea calculatoarelor introducere 15 O in C are sintaxa: conditie ? exprl : expr2 - daca conditia e adevarata, se evalueaza doar exprl, si intreaga expresie ia valoarea acesteia - daca e falsa, se evalueaza doar expr2 si intreaga expresie ia valoarea acesteia int abs(int x) return x >= 0 ? x : -x;    operator minus unar Operatori de comparatie in C: == (egalitate), != (diferit), , >= iMPORTANT! Testul de egalitate in C e == si nu = simplu !!! Obs : Functia abs exist ca functie standard, declarata in stdlib h Programarea calculatoarelor Curs 1 Marius Minea Programarea calculatoarelor introducere 16 sgn : Z, {-1,0,1} i —1 x 0 Chiar cu operatorul conditional nu putem transcrie functia direct in C (el permite doar decizia cu doua ramuri (adevarat fals), nu cu un numar mai mare de conditii   ramuri) => trebuie sa descompunem calculul functiei sgn (de fapt decizia asupra valorii parametrului ж) - mai mici: principiu foarte important in rezolvarea de probleme Rescriem functia cu o singura decizie in fiecare punct: sgn(x) = daca x 0) -1 ( daca x = 0 | altfel (ж > 0) 0 1 Programarea calculatoarelor Curs 1 Marius Minea Programarea calculatoarelor introducere 17 sgn(x) = daca x 0) -1 ( daca x = 0 0 | altfel (ж > 0) 1 return x laboratorul si examenul evalueaza rezultatele (nu colectiv!) - consultati cadrele didactice in caz de nelamuriri — invatati impreuna - prezentati solutiile altora (modificate sau nu) ca ale voastre (nu numai la acest curs): o (carti, articole, pagini de web, idei ale altora) Programarea calculatoarelor Curs 1 Marius Minea introducere 4 - conceptul de compilator: descris prima data de Grace Hopper (1952) - 1954-1957: limbajul si compilatorul FORTRAN (John Backus, iBM) - 1958: LiSP (LiSt Processing, John McCarthy, la MiT) (Lots of idiotic, Silly Parantheses :)) - 1959: COBOL (Common Business Oriented Language) dezvoltat de CODASYL: Committee on Data Systems Languages - 1960: ALGOL 60: limbaj structurat, a inspirat multe altele - 1964: BASiC (John Kemeny, Tom Kurtz; la Dartmouth) - 1967: SiMULA (Ole-Johan Dahl, Kristen Nygaard): primul limbaj orientat pe obiecte ! - 1968: Edsger W Dijkstra: "GO ТО Considered Harmful" - principiile programarii structurate - 1971: PASCAL (Niklaus Wirth); ulterior MODULA-2 Programarea calculatoarelor Curs 1 Marius Minea introducere 5 - dezvoltat si implementat in 1972 la АТ&Т Bell Laboratories de Dennis Ritchie http:  cm bell-labs coin cin cs who dinr chist htinl - contextul: evolutia conceptului de (ALGOL 68 BCPL В C) - necesitatea unui limbaj pentru (legatura stransa cu dezvoltat la Bell Labs) - C dezvoltat initial sub UNiX; in 1973, UNiX rescrisin totalitate in C - cartea de referinta: Brian Kernighan, Dennis Ritchie: (1978) -in 1988 (vezi K&R editia ii) limbajul a fost standardizat de ANSi (American National Standards institute) - dezvoltari ulterioare: C99 (standard iSO 9899) Programarea calculatoarelor Curs 1 Marius Minea introducere б - limbaj de nivel : ofera tipuri, operatii, instructiuni simple fara facilitatile complexe ale limbajelor de nivel (foarte) inalt (nu: tipuri multime, concatenare de siruri, etc ) - limbaj de programare (functii, blocuri) - permite programarea , apropiat de hardware acces la reprezentarea binara a datelor mare libertate in lucrul cu memoria foarte folosit in programarea de sistem, interfata cu hardware - produce un cod (compact in dimensiune, rapid la rulare) apropiat de eficienta limbajului de asamblare datorita caracteristicilor limbajului, si maturitatii compilatoarelor - (spre deosebire de PASCAL) conversii implicite si explicite intre tipuri, char e tip intreg, etc Programarea calculatoarelor Curs 1 Marius Minea introducere Pascal litere mari si mici: la fel declaratii in ordine: const, type, subprograme, program principal proceduri si functii integer real boolean varl, var2 : tip; nume: array[min max] of tip; Programarea calculatoarelor Curs 1 7 С diferite!! (case sensitive declaratii in orice ordine prog principal = functia main functii (pot returna si nimic) int float, double (precizii diferite) se foloseste int (valori 0 si 1) int varl, var2; tip nume[lung] ; indici de la o la lung - 1 Marius Minea introducere 8 Pascal c А ii •• V ii Operatori 1 = instructiuni begin end { } ; e separator de instructiuni ; e terminator de instructiuni if conditie then instr while conditie do instr repeat instr until cond for cnt := min to max do if conditie instr while conditie instr do instr while instr for (exp  nit; exp test;expJncr) instr nume fct := expr return expr ; Comentarii { } sau (* *)  * *  Programarea calculatoarelor Curs 1 Marius Minea introducere 9 void main(void) { } - cel mai mic program: nu face nimic ! - pornind de la el, scriem orice program, adaugand cod intre { si } - orice program contine functia si e executat prin apelarea ei (programul poate contine si alte functii) -in acest caz: functia nu returneaza nimic (primul ), si nu are parametri (al doilea ) Vom discuta: main poate lua si argumente, si returna un int Programarea calculatoarelor Curs 1 Marius Minea introducere 10  * Acesta este un comentariu *  void main(void)    comentariu pana la capat de linie  * Acesta e un comentariu pe mai multe linii obisnuit, aici vine codul programului *  - programele pot contine , inscrise intre  * si *  sau incepand cu    si terminandu-se la capatul liniei (ca in C++) - orice continut intre aceste caractere nu are nici un efect asupra generarii codului si executiei programului - programele comentate - pentru ca un cititor sa le inteleaga (altii, sau noi, mai tarziu) - ca documentatie si specificatie: functionalitate, restrictii, etc Programarea calculatoarelor Curs 1 Marius Minea introducere 11 #include void main(void) printf("hello, world! n");  * tipareste un text *  - prima linie: obligatorie pentru orice program care citeste sau scrie = o , include fisierul stdio h care contine declaratiile functiilor standard de intrare iesire - adica informatiile (nume, parametri) necesare compilatorului pt a le folosi corect - printf ("print formatted"): o functie standard implementata intr-o biblioteca care e inclusa (linkeditata) la compilare - N B : printf nu este o instructiune sau cuvant cheie - e apelata aici cu un parametru sir de caractere - sirurile de caractere: incluse intre ghilimele duble " -  n este notatia pentru caracterul de linie noua Programarea calculatoarelor Curs 1 Marius Minea introducere 12 void main(void) { int sum;  * declaram o variabila intreaga *  int a = 2, b;  * o variabila initializata, alta nu *  b = 3; sum = a + b;  * semnul de atribuire in C este = *  - o variabila trebuie (cu tipul ei) inainte de folosire - poate fi optional la declarare - cateva tipuri standard: caracter char, intreg int, real float - corpul unei functii formeaza un , intre { si } - contine , urmate de o in ANSi C, instructiunile vin dupa declaratii (nu se pot amesteca) in C++si C99, se pot intercala oricum Programarea calculatoarelor Curs 1 Marius Minea introducere 13 #include void main(void) int x; x = 5; printf("Numarul x are valoarea: printf ("° od" , x) ; Pentru a tipari valoarea unei expresii, printf ia doua argumente: - un sir de caractere (specificator de format): %c (caracter), %d (intreg), %f (float), %s (sir), etc - expresia, al carei tip trebuie sa fie compatibil cu cel indicat (verificarea cade in sarcina programatorului !!!) Programarea calculatoarelor Curs 1 Marius Minea introducere 14 #include void main(void) int x; scanf ("° od", &x) ; printf ("° od" , x) ; - scanf: functie de citire formatata, perechea lui printf - primul argument (sirul de format) la fel ca la printf - deosebirea: inainte de numele variabilei apare operatorul & (adresa) in C, parametrii se pot transmite transmitand explicit lui x, scanf stie unde sa puna valoarea Programarea calculatoarelor Curs 1 Marius Minea introducere #include void main(void) int a, b, sum; printf("introduceti scanf ("° od", &a) ;  * printf("introduceti scanf ("° od", &b) ; un numar: "); numarul se cit alt numar: "); sum = a + b; printf ("Suma este ° od n" , sum); Programarea calculatoarelor Curs 1 15 este in variabila a *  Marius Minea introducere 16 in Pascal, read write(in) ia oricate argumente, de orice tip; compilatorul trateaza detaliile de formatare specifice fiecarui tip in C, printf scanf iau tot un numar arbitrar de argumente: - primul este un sir de caractere (care indica formatul) - restul: expresii (printf) sau adrese (scanf) cu tipuri corespunzatoare celor indicate in sirul de format int x, y; scanf ("’ od’ od’ ’, &x, &y); printf ("Suma lui ° od si ° od este ° od n", x, y, x + y) ; Programarea calculatoarelor Curs 1 Marius Minea introducere 17 #include void main(void) int x; printf("introduceti un numar: scanf ("° od", &x) ; if (x , = intrebare: ce face fragmentul urmator pentru x = -1, у = -2 ? if (x > 0) if (y > 0) printf("unu"); else printf("doi"); Raspuns: else apartine de cel mai apropiat if (precedent) Programarea calculatoarelor Curs 1 Marius Minea introducere 19 Exemplu: cate cuvinte suntintr-o linie de text ? Solutie: reprezentam schematic structura textului intr-o linie: Notatii (folosite in informatica pentru a descrie ): (ceva)* = zero sau mai multe aparitii ale lui "ceva" (ceva)+= una sau mai multe aparitii ale lui "ceva" linie = (spatiu)* ((altceva)+(spatiu)*)*  n sau linie = ((spatiu)* (altceva)*)*  n unde: altceva = orice caracter in afara de spatiu si  n Putem transforma acum schema direct in program: - fiecare grup de forma (ceva)* corespunde unui ciclu while - conditia din ciclu: ce fel de caractere fac parte din "ceva" Programarea calculatoarelor Curs 1 Marius Minea introducere #include void main(void) char c; int words = 0; c = getcharO ;  * citeste un ca while (c == ’ ’) c = getcharO; while (c != ’ n’) { words = words + 1; while (c != ’ ’ && c != ’ n’) while (c == ’ O c = getchar( printf ("° od" , words) ; printf(" cuvinte n"); Programarea calculatoarelor Curs 1 20 racter de la intrare *   * spatii la inceput *  c = getcharO;  * cuvant *  );  * spatii *  Marius Minea introducere 21 Multe programe "interesante" au cicluri (sau recursivitate) Trebuie: - sa proiectam programul asa incat - sa fim siguri ca la iesirea din ciclu da rezultatul dorit Cum ? Nu prin incercari, ci rationand dupa o anumita schema: cautam un (proprietate) adevarat(a) la fiecare iteratie Fie programul while ( E ) do S; Vrem sa demonstram ca dupa terminare e adevarata proprietatea Q Cautam un i cu urmatoarele proprietati: -ie adevarat inainte de a incepe ciclul while - daca i si E sunt adevarate (se intra in ciclu), dupa executia corpului S, e din nou adevarat i - daca i e adevarat si E e fals (ciclul s-a terminat), putem deduce Q Programarea calculatoarelor Curs 1 Marius Minea introducere 22 #include void main(void) int m, lo = 0, hi = 1023; printf("Ganditi-va la un numar intreg intre 0 si printf ("° od n" , hi) ; do {  * invariant: lo m, deci N >= m + 1, deci facem lo = m + 1; * daca nu, atunci N lo = N = hi *  printf ("Numarul este ° od ! n", lo) ; Programarea calculatoarelor Curs 1 Marius Minea introducere 23 sirul lui Fibonacci: Fq = Fi = 1, Fn = Fn i + Fn 2 (n > 2) #include int fib(int n) if (n void main(void) int n, f, fl, f2; printf("introduceti numarul n: scanf ("° od", &n) ; printf ("Fibonacci (° od) = ", n) ; f = 1; fl = 1;  * f = fib(k); fl = fib(k-l); cu к = 1 *  n = n - 1; while (n > 0) {  * invariant: k+n = N (val data pt n) *  f2 = fl;  * f2 = fib(k-l) *  fl = f;  * fl = fib(k) *  f = fl + f2;  * f = fib(k+l), deci к creste cu 1 *  n=n-l;  * n scade cu 1 *  Programarea calculatoarelor Curs 1 Marius Minea Marius Minea 2 octombrie 2003 introducere 2 - familiaritate cu sisteme PC, lucru cu fisiere, medii de programare -in principal la laborator - de la exemple la programe pentru situatii reale - programarea = dezvoltarea unui produs software, de la A la Z - buna cunoastere a unui limbaj de programare si un punct de plecare pentru altele - principii si stil de programare Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 3 = o secventa de instructiuni care comanda executia calculatorului - program executabil: cod masina interpretabil direct de calculator - program sursa: in limbaj inteligibil de programatorul uman Traducerea din format sursa in format executabil: - compilare: anterior rularii programului - interpretare: direct la rulare in mod tipic, un program generic: - citeste datele de intrare - efectueaza calcule prelucrari asupra lor - produce niste rezultate de iesire Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 4 - unitate centrala de prelucrare (CPU) - unitate de control - unitati aritmetice si logice pentru calcul - memorie primara: circuite integrate secundara: medii magnetice (disc fix, floppy), optice (CD) - echipamente periferice (dispozitive de intrare iesire) tastatura, mouse, ecran, imprimanta, joystick Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 5 John von Neumann (1945) - propune arhitectura mentionata (control, UAL, memorie, i O) - si conceptul de program memorat Acestea stau la baza tuturor calculatoarelor conventionale Functionarea: 1 citeste instructiunea de la adresa din numaratorul de program 2 inainteaza numaratorul de program la urmatoarea instructiune 3 unitatea de control decodifica instructiunea si comanda operatia (care poate modifica registri, memoria, numaratorul de program) 4 se reia ciclul de la punctul 1 Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere б - gestioneaza resursele unui sistem de calcul (timpul de procesare al unitatii centrale, memoria, perifericele, sistemul de fisiere) - creeaza o abstractie independenta de hardware - ofera apeluri sistem utilizate din limbaje de programare (alocare de memorie, citire, tiparire) Urmarim: scrierea de programe portabile, independent de sistemul de operare si mediul de programare folosit Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere - Definirea si analiza specificatiilor - Proiectare - implementare (Codare) - Testare - Mentenanta Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 8 La curs: enuntul problemei in realitate insa: - adesea cea mai dificila parte - trebuiesc eliminate ambiguitatile - neintelegerile au efecte pentru tot restul proiectului - important: nu "ce stiu eu sa fac" ci "ceea ce se cere" (de client) - arhitectura programului -impartirea in componente si interfata intre ele - proiectarea structurilor de date - proiectarea algoritmilor - interfata cu utilizatorul Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 9 - ce face programul ? pot defini in mod precis ? (absolut necesar!) - pot gasi o relatie matematica ? - pot urmari pas cu pas transformarea pe care o efectueaza programul si sa demonstrez (sa ma conving) astfel ca rezultatul final e corect ? - ce se schimba pe parcursul programului ? ce ramane neschimbat ? (exemplu: folosirea invariantilor in rationamentul despre cicluri) - urmarirea rationamentului in faza de implementare reduce erorile - ce presupuneri garantii exista despre intrare ? - ce presupuneri garantii exista despre alte module de program ? - cum se comporta programul: pentru date normale, limita, eronate care e performata pt date de dimensiuni mari ? Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 10 - complexitatea sistemului creste pe masura realizarii - documentatie necesara pentru: - descriere exacta a functionalitatii sistemului, impreuna cu toate cerintele, restrictiile, presupunerile - comunicarea dintre programatori (chiar pt programatorul initial!) - proiectarea de teste, evolutia si mentenanta ulterioara - cat de generala este solutia ? poate fi reutilizata ? - se pot folosi elemente existente ? (functii de biblioteca, module de program, obiecte, etc ) - programul e proiectat pentru a fi intretinut usor ? - robustete, rezistenta la date de intrare invalide Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 11 - 2 ore de curs - 1 ora de seminar (2 la 2 saptamani): ing Radu Fericean - 2 ore de laborator: prep ing Loredana stefanut -60% examen 1 2 partial (30%), 1 2 final (30%) -40% activitate pe parcurs (30% laborator, 10% seminar) Consultatii: la birou (B 531) - o ora fixa pe saptamana (libera in orar): joi 12-14 ? - sau stabiliti o alta ora prin   (mariusQcs utt ro) Pagina de curs: la http:  www cs utt ro  marius curs upc Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 12 Scopul cursului: ca fiecare din voi sa ajungeti sa programati bine => cursul va evalua rezultatele fiecaruia dintre voi — consultati cadrele didactice in caz de nelamuriri — invatati impreuna - prezentati solutiile altora (modificate sau nu) ca ale voastre Principiu de baza: orice sursa folosita trebuie citata Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 13 = secventa finita de pasi pentru rezolvarea unei probleme : reprezentarea grafica a unui algoritm - fara particularitatile unui anumit limbaj de programare, dar precis Blocuri (instructiuni) componente in scheme logice: start, stop, atribuire, citire, scriere, decizie schema logica: graf format din cele 6 tipuri de instructiuni, cu un singur nod de START si unul singur de STOP Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 14 - dezvoltat si implementat in 1972 la АТ&Т Bell Laboratories de Dennis Ritchie - contextul: evolutia conceptului de programare structurata (atat Pascal cat si C inspirate de ALGOL 68) - necesitatea unui limbaj pentru programe de sistem (legatura stransa cu sistemul de operare UNiX dezvoltat la Bell Labs) - C dezvoltat initial sub UNiX; in 1973, UNiX rescris in totalitate in C - cartea de referinta: Brian Kernighan, Dennis Ritchie The C Programming Language (1978) -in 1988 (vezi K&R editia ii) limbajul a fost standardizat de ANSi (American National Standards institute) - dezvoltari ulterioare: C99 (standard iSO 9899) Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 15 - limbaj de nivel mediu ofera tipuri, operatii, instructiuni simple fara facilitatile complexe ale limbajelor de nivel (foarte) inalt - limbaj de programare structurat - permite programarea la nivel scazut, apropiat de hardware acces la reprezentarea binara a datelor mare libertate in lucrul cu memoria foarte folosit in programarea de sistem, interfata cu hardware - produce un cod eficient (compact in dimensiune, rapid la rulare) apropiat de eficienta limbajului de asamblare datorita caracteristicilor limbajului, si maturitatii compilatoarelor Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 16 void main(void) { } - cel mai mic program: nu face nimic ! - pornind de la el, scriem orice program, adaugand cod intre { si } - orice program contine functia main si e executat prin apelarea ei (vom vedea mai tarziu ca poate contine si alte functii) -in acest caz: functia nu returneaza nimic (primul void), hsc nu are parametri (al doilea void) Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 17  * Acesta este un comentariu *  void main(void)  * Acesta e un comentariu pe mai multe linii obisnuit, aici vine codul programului *  - programele pot contine comentarii, inscrise intre  * si *  - orice continut intre aceste caractere nu are nici un efect - programele trebuie comentate - pentru ca un cititor sa le inteleaga (altii, sau noi, mai tarziu) - ca documentatie si specificatie: functionalitate, restrictii, etc Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 18 #include void main(void) printf("Hello, world!");  * tipareste un text *  - prima linie: obligatorie pentru orice program care citeste sau scrie (o directiva de preprocesare, include fisierul stdio h care contine declaratiile functiilor standard de intrare iesire) - printf ("print formatted"): o functie standard implementata intr-o biblioteca care e inclusa (linkeditata) la compilare - N B : printf nu este o instructiune sau cuvant cheie - e apelata aici cu un parametru sir de caractere - sirurile de caractere: incluse intre ghilimele duble " Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 19 void main(void) { int sum;  * declaram o variabila intreaga *  int a, b;  * declaram inca doua variabile intregi *  a = 2; b = 3; sum = a + b;  * semnul de atribuire in C este = *  - pentru a memora data si calcula, avem nevoie de variabile o variabila are un nume, un tip si o valoare - o variabila trebuie declarata (cu tipul ei) inainte de folosire - cateva tipuri standard: caracter char, intreg int, real float - corpul unei functii formeaza un bloc, intre { si } - blocul poate contine declaratii si o secventa de instructiuni Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 20 #include void main(void) int x; x = 5; printf("Numarul x are valoarea: printf ("° od" , x) ; Pentru a tipari valoarea unei expresii, printf ia doua argumente: - un sir de caractere (specificator de format): %c (caracter), %d (intreg), %s (sir), etc - expresia, al carei tip trebuie sa fie compatibil cu cel indicat (verificarea cade in sarcina programatorului !!!) Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere 21 #include void main(void) int x; scanf ("° od", &x) ; printf ("° od" , x) ; - scanf: functie de citire formatata, perechea lui printf - primul argument (sirul de format) la fel ca la printf - deosebirea: inainte de numele variabilei apare operatorul & (adresa) (adresa variabilei, adica locul unde va fi memorata valoarea; detalii ulterior) Utilizarea si programarea calculatoarelor Curs 1 Marius Minea introducere #include void main(void) int a, b, sum; printf("introduceti scanf ("° od", &a) ;  * printf("introduceti scanf ("° od", &b) ; un numar: "); numarul se cit alt numar: "); sum = a + b; printf ("Suma este ° od n" , sum); Obs :  n este caracterul de linie noua Utilizarea si programarea calculatoarelor Curs 1 22 aste in variabila a *  Marius Minea introducere #include void main(void) int x; printf("introduceti un numar: "); scanf ("° od", &x) ; if (x , = Utilizarea si programarea calculatoarelor Curs 1 Marius Minea Marius Minea marius@cs upt ro http:  cs upt ro  marius curs lsd  2 octombrie 2017 Am revazut: functii (injective, surjective, bijective, inversabile) Am definit functii intr-un si sunt in limbajele de programare Tipurile ne spun pe ce fel de valori poate fi folosita o functie g f x = g (f x) val comp: (’a -> ’b) -> (’c -> ’a) -> ’c -> ’b = у X у e de fapt predefinita, nu e nevoie s-o definim inca o data Putem compune de un numar dat de ori (numar fix de argumente) xl x2 x3 = max xl (max x2 x3) xl x2 x3 x4 = max xl (max x2 (max x3 x4)) Nu putem inca: exprima ca vrem sa lucram cu N valori (lista, multime, tablou) defini un calcul pentru un numar arbitrar de valori Recursivitatea e fundamentala in informatica: daca o problema are solutie, se reducand problema la un caz mai simplu al => intelegand recursivitatea, putem rezolva orice problema (daca e fezabila) 0 notiune e daca e O (putin mai) complicata: (2 + 3) * (4 + 2 * 3) — 5 * 6 (7 - 2) + (4 + 3 - 2) (7 - 3) Pentru a calcula, trebuie sa intelegem expresiei (nu se vede tot timpul usor intr-un sir de caractere) E a doua subexpresii ( e calculat ultimul): (2 + 3) * (4 + 2 * 3) - 5 * 6 (7 - 2) (4 + 3 - 2) (7 - 3) Apoi calculam (2 + 3) *(4 + 2*3) 5 *6 (7-2) = 44 (4 + 3-2) (7 - 3) = 1 44 1 = 45 Calculul celor doua subexpresii: dupa Ce ne-a permis sa calculam expresia complicata? e suma a doua mai simple vom folosi definite Exprimam elementari (cei mai simpli) putem aduna, imparti, etc doua identificam cand expresia e un simplu numar, nu mai trebuie facut nimic Ce e o expresie numerica? int + int 5 + 2 int - int 2 — 3 int * int -1*4 int   int 7 3 Se poate mai simplu? Da: int (5 e caz particular de expresie) Se poate si mai complicat? Da: int * (int + int) (int - int)   int Putem scrie un numar finit de reguli ? о 'intreg expresie + expresie 10—>5—>16—>8—>4—>2—>1 11—>34—>17—>52—>26—>13—>40—>20—>10—>5—>16—>8—>4—>2—>1 Definim functia p : iT —> N care numara pasii pana la oprire: pentru 3—>10—>5—>16—>8—>4—>2—>1 avem 7 pasi Nu avem o formula cu care sa definim p(n) direct Dar daca sirul n, ajunge la 1, atunci numarul de pasi parcursi de la n (mai sus: 3) e cu unul mai mare decat continuand de la f(n) (aici: 10) p(n) = 0 1 + р(Ф0) Functia p a fost definita daca n = 1 (am ajuns) altfel (daca n > 1) : e folosita in propria definitie n = n mod 2=0 n 2 3*n+l Revedem: c el e2 e o daca c e adevarata, are valoarea lui el, altfel valoarea lui e2 n = n = 1 0 1 + p (f n) Cuvintele cheie introduc o functia p e folosita (apelata) in propria definitie Fara , fie p din dreapta ar fi necunoscut (eroare), fie s-ar folosi o eventuala definitie anterioara (deci nu ar fi recursiva) in interpretor, vizualizam apelurile si revenirea cu directiva #trace numefunctie revenim la normal cu #untrace numefunctie in calculul recursiv: Fiecare apel face "in cascada" , pana la cazul de baza Fiecare apel executa , dar cu (valori proprii pentru parametri) Ajunsi la cazul de baza, toate apelurile facute sunt inca (fiecare mai are de facut adunarea cu rezultatul apelului efectuat) Revenirea se face apelarii (ultimul apelul revine primul, apoi revine penultimul apel, etc ) Putem scrie functia si asa: i 1 -> O i n -> 1 + p (f n) Sageata sugereaza functia definita ca diagrama Citim astfel: e o functie: - daca argumentul e 1, valoarea functiei e 0 - daca argumentul are orice alta valoare (o notam n), valoarea functiei e 1 + p (f n) Cuvintele cheie si se folosesc diferit! cu xl x2 -> expresie putem scrie cu oricati parametri xl, x2 cu definim o functie prin cu parametru (NU scriem let p n = ) Fiecare ramura defineste in stanga lui -> un si in dreapta rezultatul (putem folosi numele introduse in tiparul din stanga) Argumentul care e potrivit cu tiparul poate fi: o (aici, 1) o (pereche, lista cu cap coada, etc ) perechile se noteaza (x, y) ca in matematica triplete: (a, b, c), etc un (nume) care indica tot argumentul (oricare ar fi) Nu putem avea ca tipar (doar) o conditie x > 5 Potrivirile se incearca in ordinea indicata, pana la prima reusita identificatorul special (linie de subliniere) se potriveste cu orice ii folosim daca nu avem nevoie de valoarea respectiva i (0, 0) -> print string i ( , 0) -> print string i (0, y) -> Printf printf i -> print string У Ex : o functie care ia triplete de intregi si da suma componentelor pana la primul zero i (0, ) -> 0 i (x, 0, ) -> x i (x, y, z) -> X + у + z daca prima componenta e 0, rezultatul e 0, indiferent de celelalte altfel, daca a doua componenta e 0, adunam doar prima (nu si a treia) altfel, primele doua sunt nenule, si le sumam pe toate trei Daca am uitat un tipar posibil, compilatorul ne avertizeaza Rescriere echivalenta cu if-then-else: (x, y, z) = x = 0 0 у = 0 x x + y + z Pana acum: definitii = expresie argl argN = expresie Uneori sunt utile definitii auxiliare Am vrea sa scriem: Definim functia arie(a, b, c) astfel: (a, b, c = laturile triunghiului) intai definim p = (a + b + c) 2 cu aceasta notatie, aria e   p(p — a)(p — b)(p — c) a b c = = (a + b + c)   2 sqrt (p * (p a) * (p b) * (p c)) Definitia e tot de forma functie argl argN = expresie dar expresie are noua forma: icLaux = expr aux expr val Expresia are valoarea lui expr val,   p(p — a)(p — b)(p — c), unde icLaux (p) din stanga lui = are sensul din dreapta, p = (a+b+c) 2 Astfel dam un nume, p, pentru o expresie folosita de mai multe ori, (a + b + c) 2, scriind mai concis si evitand recalcularea progresie aritmetica: Xq = b (adica: xn = b pentru n = 0) xn = xn i + r pentru n > 0 Exemplu: 1,4, 7,10,13, ( ? = 1, r = 3) progresie geometrica: {xq = b (adica: xn = b pentru n = 0) xn = xn-i   r pentru n > 0 Exemplu: 3, 6,12, 24,48, ( ? = 3, r = 2) Definitiile de mai sus nu calculeaza xn direct (desi se poate) ci , folosind xn i sirul xn e => recursivitate   recurenta Scriem intai o progresie aritmetica cu baza si ratia fixate: xq = 3, xn = xn i + 2 (pentru n > 0) Notiunea recursiva (sirul) devine o Valoarea de care depinde (indicele) devine functiei i 0 -> 3 i n -> 2 + aritpr 3 2 (n-1) sau, echivalent n = n = 0 3 2 + aritpr 3 2 (n-1) Cum parametrizam functia cu baza si ratie ? Putem scrie o functie care are baza si ratia ca parametri: baza ratie = i 0 -> baza i n -> ratie + aritpr baza ratie (n-1) sau echivalent baza ratie n = n = 0 baza ratie + aritpr baza ratie (n-1) Putem defini apoi functii care corespund unor progresii individuale: = aritpr 3 2 aritpr 3 2 4 - : int = 11 aritpr baza ratie O -> baza 1 n -> ratie + aritpr baza ratie (n-1) Apare de doua ori expresia aritpr baza ratie , o functie de un argument (indicele), in care baza si ratie sunt deja fixate Rescriem dand un nume apl pentru expresia comuna (definitie locala pentru apl) in exterior definim functia initiala aritpr baza ratie egala CU apl baza ratie = apl = 0 -> baza n -> ratie + apl (n-1) apl Citim: (fie) baza ratie definita astfel: - definim functia (folosind parametrii lui : baza, ratie; apl ia indicele n si da valoarea termenului al n-lea) - atunci baza ratie e chiar apl (expresia de dupa ) are rol ajutator, nu e vizibil in afara definitiei lui Recursivitatea e fundamentala in informatica: reduce o problema la un caz mai simplu al probleme {un singur element Q sir , -4 un element urmat de un ООО O ex cuvant (sir de litere); numar (sir de cifre zecimale) : un e {un pas —> drum un urmat de un pas '——>' —> ex parcurgerea unei cai intr-un graf Pentru a reprezenta structura recursiva a unei probleme, ne trebuie adesea definite recursiv in ML putem tipuri recursive Un tip recursiv pentru expresii (incluzand operatorii de calcul): expr = i int i Add expr * expr | Sub expr * expr i Mul expr * expr | Div expr * expr Am definit un tip cu mai multe Fiecare din ele trebuie scrisa cu un (eticheta), ales de noi: i, Add, etc (orice identificator cu litera mare) Notatia expr * expr reprezinta deci o pereche de doua valori de tipul expr Tipul expr e (o valoare de tip expresie poate contine la randul ei componente de tip expresie) Expresia (2 + 3) * 7 se reprezinta: Mul (Add(i 2, 13), 17) Lucrul cu o valoare de tip recursiv se face prin (engl pattern matching), din tip i i -> i Add (el, e2) -> eval el + eval e2 Sub (el, e2) -> eval el - eval e2 Mul (el, e2) -> eval el * eval e2 Div (el, e2) -> eval el   eval e2 Evaluand expresia eval (Mul (Add(i 2, 13), i 7)) da 35 e nevoie de paranteze, pentru a grupa Mul si perechea de dupa Pentru definite care il prelucreaza vor fi natural deobicei cu cate un caz pentru fiecare varianta a tipului respectiv 1 ( necesita apel recursiv) = cel mai simplu caz pentru definitia (notiunea) data, definit direct termenul initial dintr-un sir recurent: xq un element, in definitia: sir = element sau sir + element E o daca lipseste cazul de baza (apel recursiv infinit!) 2 propriu-zisa - defineste notiunea, folosind un caz mai simplu al aceleiasi notiuni 3 Demonstratie de dupa numar finit de pasi (ex o marime nenegativa care descreste cand aplicam definitia) - la siruri recurente: indicele (> 0 dar mai mic in corpul definitiei) - la obiecte: dimensiunea (definim obiectul prin alt obiect mai mic) ? Xn+1 = 2 • xn 7 xn = xn+i 3 ? an = a • a • • a (de n ori) ? o fraza e o insiruire de cuvinte ? un sir e un sir mai mic urmat de un alt sir mai mic ? un sir e un caracter urmat de un sir 0 definitie recursiva trebuie sa fie bine formata (v conditiile 1-3) ceva nu se poate defini doar in functie de sine insusi se pot utiliza doar notiuni deja definite nu se poate genera un calcul infinit (trebuie sa se opreasca) Sa recunoastem si definim Sa recunoastem daca o definitie recursiva e (are caz de baza? se opreste recursivitatea?) Sa rezolvam probleme scriind recursive cazul de baza + pasul de reducere la o problema mai simpla Sa definim si folosim Figuri geometrice in care o parte a figurii e similara intregului acesta e aspectul recursiv Apar in natura, sau pot simula artificial figuri din natura Analiza lor are aplicatii in diverse domenii: geografie geologie, medicina, prelucrarea semnalelor, electrotehnica (microantene), etc reducem o problema la o instanta mai simpla a probleme Un obiect (notiune) e recursiv(a) daca e Exemplu din matematica: : - progresie aritmetica: x0 = a, xn = xn   + p, pentru n > 0 - progresie geometrica: x0 = b, xn = a • xn j , pentru n > 0 => formula nu calculeaza xn direct, ci 3 martie 2009 Programarea calculatoarelor Curs 2 Marius Minea Alte exemple: combinari C%, sirul - definite recursiv: un ex : cuvant (sir de litere); numar - definite recursiv: un (de exemplu o cale intr-un graf) Programarea calculatoarelor Curs 2 lui Fibonacci, J un singur element, sau | un element urmat de un (sir de cifre zecimale) | un pas, sau | un urmat de un pas Marius Minea Recursivitate Recursivitate 4 #include Obs Funcfia standard putere (cu 2 argumente double) este pow, din double pwr(double x, unsigned n) { return n==0 ? 1 : x * pwr(x, n-1); int main(void) { printf("-2 la 3 = %f n", pwr(-2 0, 3)); return 0; } - tipul unsigned reprezinta intregi fara semn (numere naturale) - antetul functiei reprezinta o declaratie a ei, deci poate fi folosita in orice punct ulterior (si in propriul corp — cazul apelului recursiv) - chiar daca scriem pwr(-2, 3), intregul -2 va fi convertit la real, intrucat se cunoaste tipul necesar pentru fiecare parametru Functia pwr face doua calcule: - un test (n == o ? a ajuns la cazul de baza ?) daca da, return 1 -daca nu, o inmultire', pt operandul drept trebuie un pwr(5, 3) apelt ti25 5 * pwr(5, 2) ape 1 1 t25 5 * pwr(5, 1) ape 1 1 j'5 5 * pwr(5, 0) apelt tl 1 Programarea calculatoarelor Curs 2 Programarea calculatoarelor Curs 2 Marius Minea Recursivitate Observam, pentru exemplul functiei putere: - fiecare apel face "in cascada" un alt apel, pana la cazul de baza - fiecare apel executa acelasi cod, dar cu (valori proprii pentru parametri) - ajunsi la cazul de baza, toate apelurile incepute suntinca (fiecare mai are de facut inmultirea cu rezultatul apelului efectuat) - revenirea se face in ordine inversa apelarii (apelul cu exponent 0 revine primul, apoi cel cu exponent 1, etc ) Programarea calculatoarelor Curs 2 Marius Minea 1 (conditia de oprire) - cel mai simplu caz pentru definitia (notiunea) data, definit direct, necesita apel recursiv Exemple: termenul initial dintr-un sir recurent un element, in cazul unui sir (v exemplu p 2) un pas, in cazul unui drum (v exemplu p 2) daca lipseste cazul de baza (apel recursiv infinit!) 2 - defineste notiunea, folosind un caz mai simplu al aceleiasi notiuni 3 demonstratie de dupa un numar finit de pasi (ex o marime nenegativa care descreste cand aplicam definitia) - la siruri recurente: indicele (nenegativ; mai mic in corpul definitiei) - la obiecte: dimensiunea (definim obiectul prin alt obiect mai mic) Programarea calculatoarelor Curs 2 Marius Minea Recursivitate Recursivitate xn+l — 2 • xn - Xn - Жп+1 2 -an = a- a- -a (de n ОГІ) - o frazd e o insiruire de cuvinte - un sir e un sir mai mic urmat de un alt sir mai mic - un sir e un caracter urmat de un sir O definitie recursiva trebuie sa fie bine formata (v conditiile 1-3) - ceva nu se poate defini doar in functie de sine insusi (x =  (")) - se pot utiliza doar notiuni deja definite - nu se poate genera un calcul infinit (trebuie sa se opreasca) unsigned cmmdc(unsigned a, unsigned b) t return a == b ? a : a > b ? cmmdc(a-b, b) cmmt c(a,6) = : cmmdcCa, b-a); {а a = b У cmmdc(a -6,6) o>6 int main(void) { cmmdc( a, 6 - o) o b ? cmmdc(a-b, b) : cmmdc(a, b-a); Programarea calculatoarelor Curs 2 Programarea calculatoarelor Curs 2 Marius Minea Recursivitate 9 10 unsigned fact 1 (unsigned n) -{ return n == 0 ? 1 : n * factl(n-l); corespunde scrierii: 5! = 5 • (4 • (3 • (2 • (1 • 1)))) calculul (*) facut la sfarsitul functiei, revenirea din apelul recursiv calcule succesive: 1*1 (1), 2*1 (2), 3*2 (6), 4*6 (24), 5*24 (120), etc unsigned fact2(unsigned n, unsigned res) t    apel initial: res=l return n == 0 ? res : fact2(n-l, res*n); corespunde scrierii: 5! = (((( • 5) • 4) • 3)   2) • 1 ni = П' (n- 1)! =4" trebuie inmultit cu n, chiar daca nu stim cat e (n-1)! =4" acumulam   actualizam un rezultat partial, transmis ca pentru urmatorul apel; in cazul de baza, rezultatul e complet si returnat valori res: 1, 5 (5*1), 20 (4*5), 60 (3*20), 120 (2*60), 120 (1*120) Am rezolvat recursiv o problema mai generala: calculam res-n! Vrem res=l =i> definim unsigned fact (unsigned n) t return fact2(n, 1); }  Programarea calculatoarelor Curs 2 Marius Plinea factl(3) apel у t6 3 * factl(2) ape 1 1 t2 2 * factl(l) apel у tl 1 * fact 1(0) apel у tl 1 - apelul: in calculul rezultatului -inmultirea: dupa revenirea din apel calcul: 3 • (2 • (1 • 1)) Programarea calculatoarelor Curs 2 Recursivitate fact2(3, 1) apel у t6 fact2(2, 3) apel у t6 fact2(l, 6) apel у t6 fact2(0, 6) ap el у t6 6 - calculul: inainte de apel (rezultatul partial acumulat transmis ca parametru) - la revenire: nici un calcul; valoarea returnata nemodificat calcul: (((1   3)   2)   1) Marius Plinea Recursivitate 12 Forma: s0 = ^o- sn = sn i + in, pentru n> 0 (in = termenul general) Exemplu pentru seria armonica (in = 1 n): 1 1 + 1 2 + + 1 n #include double suma rec(unsigned n) t return n == 0 ? 0 : suma rec(n-1) + 1 0 n; int main(void) t printf("suma pana la 1 100: %f n", suma rec(100)); return 0; Am transcris direct definitia recursiva: s0 = ^o- sn = sn-i + 1 n (n > 0) Termenii se aduna incepand de la 1 1 la 1 100, la revenirea din apel 1 0   n : operatie intre real si intreg : intregul convertit la real : 1 n da valoarea o cand n > 1 (impartire intreaga) Programarea calculatoarelor Curs 2 Plarius Plinea in sn = sn-i + 1 n, trebuie adunat 1 n, dar nu stim inca sn i =4" folosim un rezultat partial la care adunam 1 n (adunam termenii pornind de la 1 n spre 1 1) =4" cand facem apelul suma inv(n, rez), rez e suma deja calculata a termenilor din dreapta celui curent (in) double suma inv(unsigned n, double rez) t    apel initial: rez=0 return n == 0 ? rez : suma inv(n - 1, rez + 1 0 n); - daca n — 0, totul e adunat deja in rez, care e returnat ca rezultat - altfel, rezultatul e suma primilor n-1 termeni (apel recursiv) pornind de la rezultatul partial rez plus termenul curent 1 n in apelul initial, rezultatul acumulat e zero: suma inv(ioo, o o) rez e un detaliu de implementare, nu face parte din enuntul problemei =4" definim o functie cu un singur parametru, care apeleaza suma inv: double serie armonica(unsigned n) -{ return suma inv(n, 0 0); }  Programarea calculatoarelor Curs 2 Plarius Plinea Recursivitate Recursivitate Din matematica: a0 = 1, an+1 =-^(an + ^-) Formulam recursiv: calculul (ex cu e = iO-3) de la o : ce se cere = val functiei ce se da (parametru) - daca precizia e buna |an | i —an|    pt double fabs(double x) val abs nr real double rad(double x, double a n) {    rad lui x, se da aprox a n return fabs(a n - x a n) 0), cu s0 = 0 pana cand valoarea absoluta a termenului in = xn n  e suficient de mica Formulam recursiv: calculul , data fiind - daca termenul curent in e suficient de mic, returnam suma curenta - altfel, returnam suma calculata , de la sn j + in Exemplu: seria 1 + 1 22 + 1 32 + = тг2 б t" = 1 n2 (n > 0): double sum 2(unsigned n, double s n l) t return l  n n 0) Pentru a nu recalcula inutil in in pe xn 1 si (n- 1)! exprimam recursiv in = in i   x n, pentru n > 0, t0 = 1 => la pasul curent, avem sn 2 si in-i’ calculam in si sn i = sn 2+fn-i #include #include double e x(double x, unsigned n, double s n 2, double t n l) t return fabs(t n l) se preteaza la definitii recursive -insiruiri liniare: un program are oricate functii, o functie are oricate argumente si instructiuni, etc - structuri mai complexe, ex expresie formata din operator si 2 expresii Structura ( ) limbajului se reprezinta uzual printr-o notatie standard numita BNF (Backus-Naur Form) Exemplu: antet-functie ::= tip identificator ( parametri ) parametri ::= void | lista-parametri lista-parametri ::= tip identificator | tip identificator , lista-parametri unde ::= denota definitie iar | alternativa (alegere) Cazuri particulare: recursivitate la stanga si la dreapta, dupa locul in care apare notiunea recursiva in corpul definitiei Programarea calculatoarelor Curs 2 Marius Minea introducere in limbajul C 19 octombrie 2004 - Cateva exemple - Scheme logice si programe structurate - instructiuni de ciclare - Tablouri Utilizarea si programarea calculatoarelor Curs 2 Marius Minea #include void main(void) int a, b, c; printf("introduceti trei numere intregi a b c: "); scanf ("7 d * ,d 7,d", &a, &b, &c);  * sau * ,d* ,d* ,d (la fel) *  printf("Cel mai mic numar este "); if (a  * functii matematice *  #include void main(void) float a, b, c, bl, d, delta; printf("Coeficientii ecuatiei: ");  * ax"2+bx+c=0 *  scanf ("7 f7 f7 f" , &a, &b, &c); bl = -b (2 0*a); delta = bl*bl - c a; if (delta == 0) printf("Solutie dubla: 7"f n", bl); else if (delta > 0) { d = sqrt(delta);  * radacina patrata *  printf ("Solutii: % lf si % lf n", bl+d, bl-d); } else  * delta 0 int n, p, x; p = 1;  * valoarea initiala, x la puterea 0 *  while (n > 0) {  * n = de cate ori mai trebuie inmultit cu x *  p = p * x;  * facem inmultirea *  n = n - 1;  * a ramas cu o inmultire mai putin de facut *  Utilizarea si programarea calculatoarelor Curs 2 Marius Minea Utilizarea si programarea calculatoarelor Curs 2 Marius Minea introducere in limbajul C introducere in limbajul C do instructiune  * poate fi { compusa } *  while ( expresieJogica ); - se executa instructiunea - se evalueaza expresia - daca expresia e adevarata, se revine la executia instructiunii - daca expresia e falsa, ciclul se incheie Exemplu: char raspuns; do { printf("Apasati ’d’ pentru a continua: "); scanf (" 7,c", feraspuns);  * citeste caracter, sare peste spatii *  } while (raspuns != ’d’);  * pana la raspunsul dorit *  Obs: in Pascal, din repeat untii se iese pe conditie true (invers!) Utilizarea si programarea calculatoarelor Curs 2 Marius Minea exp mit; while (exp-test) { instructiune; exp cont; } P = 1; while (n > 0) { p = p * x; n = n - 1; for (expJnit ; exp test ; exp cont) instructiune e echivalenta* cu: * exceptie: instructiunea continue, vezi ulterior Calculul puterii: for (p=l;n>0;n=n-l) p = p * x; - oricare din cele 3 expresii poate lipsi (dar cele doua ; raman) - daca exp test lipseste, e tot timpul adevarata (ciclu infinit) Cel mai simplu si frecvent caz: cand stim numarul de iteratii: int i;  * variabila cu care numaram iteratiile *  for (i = 0; i 0);  * i e numarul de cifre *  do { i = i - 1;  * prima cifra e la pozitia i - 1 *  printf("%d", cifre [i]); }• while (i > 0);  * ultima cifra e la pozitia 0 *  Utilizarea si programarea calculatoarelor Curs 2 Marius Minea Exista tablouri de oricate dimensiuni Pentru 2: matrici: int m ; interpretare: tablou de 10 elemente, fiecare un tablou de 7 intregi void main(void) { int i, j, m , sumcol ;  * matrice si suma pe coloane *  printf("Dati pe linii si coloane o matrice 5x3 de intregi n"); for (i = 0; i i 3 => multimi de stari: reprezentate prin formule logice - s t s': o formula peste V и V V — copie a lui V (variabilele starii urmatoare) ex (semaphore = red) A (semaphore  = green) - multimea tuturor tranzitiilor: relatia de tranzitie: formula TZ(V,V') Verificare formala Curs 2 Marius Minea Structura Kripke: automat cu stari finite, etichetat: M = (5,50, R, L) - S: multime finita de stari - Sq C S: multimea starilor initiale - R C S S: totala: Vs € S 3s' € S (s, s') € R (din orice stare exista cel putin o tranzitie) 2ap: functie de a starilor AP — multime de (observatii care apar in for- mule proprietati specificatii) Exemple: - o stare are atributul stabil sau nu - definim propozitia bad ::— red recvd > 1 Traiectorie pornind din starea sq: secventa infinita de stari - = sosis2 , cu R(si,si+1) pentru orice i > 0 Verificare formala Curs 2 Marius Minea Model Checking Notiuni de baza 5 Model Checking Notiuni de baza 6 Tipuri de compozitie: (obtinerea comportamentului sistemului din cel al componentelor) • : conjunctie (tranzitii simultane) R(V,V') = Ri(Vi,Vi') л R2(V2,V^) V = Vi Л Circuite secventiale: o variabila pentru fiecare element de stare (registru), si pentru intrarile primare se presupune: propagare combinationala instantanee Circuite asincrone: o variabila pentru fiecare semnal (in modele mai sofisticate: timp fizic explicit) Programe: variabile declarate + contorul de program • : disjunctie (tranzitii individuale) R(V, V') = Ri(Vi, V0 A Eq(V   Vi) V R2(V2, V2') A Eq(V   V2) E o computatie — secventa infinita de stari =• nu e suficienta reprezentarea comportamentului de intrare-iesire - Exemple simple: nu se atinge o anumita stare (de eroare) sistemul nu se blocheaza (deadlock) Mai general: proprietati descrise in - logica modala (notiune de adevar cu modalitati temporale) - utilizata din antichitate in rationamente despre timp - [Pnueli'77] - aplicare la programe concurente Verificare formala Curs 2 Marius Minea [Pnueli 1977] - ne intereseaza descrierea evenimentelor de-a lungul unei traiectorii => structura liniara in viitor apare un eveniment; o proprietate e invarianta de la un moment dat; un eveniment apare dupa alt eveniment Operatori temporali (modalitati de adevar pe o traiectorie): • X(next): in urmatoarea stare o • F (futuret candva in viitor O • G(globally)' in orice stare viitoare □ • U(until): propi obligatorie pana cand apare prop? uneori se mai defineste si urmatorul operator: • R(release)' aparitia propi elimina obligativitatea props Verificare formala Curs 2 Marius Minea Model Checking Notiuni de baza Model Checking Notiuni de baza 10 Notam: Л , s |= f: in modelul M, starea s satisface f я' — sufixul traiectoriei я- — incepand cu s,- - dorim ca o proprietate sa fie adevarata pentru toate traiectoriile => folosim cuantificatorul universal A - formulele sunt de tipul Af, unde f este o formula de traiectorie - sintaxa formulelor de traiectorie: f p (unde p p AP) i -fi i fi v  2 i Л л  2 i Xfj i Ffj i Gfj i fiUf2 i fiRf2 Verificare formala Curs 2 Marius Minea M, s |= p O P   L(s) Л , s |= A f o V traiectorie я din s, M,-, rkf M, я |= p o M,s =p, unde p p AP si s e prima stare din Л  яІ^-f o Af,- я- f Af я |= fj V f2 o Af,- я |= fi V M, я |= f2 Af я- 1= f 1 A f2 o Af,- я |= fl Л M, я |= f2 Af^|=Xf o Af,- я* 1 kf Af"|=Ff o Bk > 0 M, vk 1= f Afw|=Gf o v к: > 0 M, я* f o Bk > 0 Af я* f2AV) 0 (V) f=kf2 Verificare formala Curs 2 Marius Minea Model Checking Notiuni de baza 11 Model Checking Notiuni de baza Uneori: modelul liniar insuficient (ex e posibil sa se atinga o stare) => alt model: arbori de computatie (computation trees): desfasurare infinita a grafului de stari-tranzitii pornind de la o stare initiala in plus: cuantificatorul existential E (exista o traiectorie) 3 Doua tipuri de formule: - formule de stare (state formula), evaluate intr-o stare f p (unde p E AP) i ^fi i fi V f2 | fi л f2 | Ej | Aj (unde g — formula de traiectorie) - formule de traiectorie (path formula), evaluate pe o traiectorie g f (unde f — formula de stare) i ^91 i 91 V P2 i 91 A P2 i Xpi | Fpi | Gpi | pi Up2 i 91 RS2 Semantica: la fel ca LTL, in plus: M, s Ep 4" 3 traiectorie я din s cu M, я |=p Verificare formala Curs 2 Marius Minea Verificare formala Curs 2 Marius Minea Model Checking Notiuni de baza 13 Model Checking Notiuni de baza f h g = V ^g) fRg = ^fU^g) F f = trueU f Gf = F-f Af = ^E ^f => Operatorii - , v, X, U si Esunt suficienti pentru a exprima orice formula in CTL* [Clarke, Emerson 1981] - suficienta in multe cazuri, dar mai simpla => algoritmi mai eficienti - structura ramificata (branching) ca si CTL* - cuantificare asupra traiectoriilor posibile dintr-o stare - operatorii X, F, G , U, R precedati imediat de A sau E - sintaxa formulelor de traiectorie: g::^Xf | Ff | Gf | | ftR 2 Verificare formala Curs 2 Marius Minea Verificare formala Curs 2 Marius Minea Model Checking Notiuni de baza 15 Model Checking Notiuni de baz3 10 operatori de baza, exprimabili folosind EX, EGsi EU: АХ =- EX-   EF   = E [trueU ] AF   = -EG - f AGf = -EF-  A( Uj] = Л нЕ^иЬ Л^)] E[ Rj] =- A [-  U- se defineste noua semantica pentru CTL cu fairness O restrictie de fairness e o formula in logica temporala O traiectorie e echitabila daca fiecare restrictie e adevarata infinit de multe ori de-a lungul traiectoriei in particular: restrictie exprimata ca multime de stari: o traiectorie echitabila trece infinit de multe ori prin acea multime Verificare formala Curs 2 Marius Minea Verificare formala Curs 2 Marius Minea Model Checking Notiuni de baza 19 Model Checking Notiuni de baza Augmentam structura Kripke, M — (S,So, R,L,F), cu FQ 2s (F — multime de submultimi de stari, {Pi,      , Pn}, Д C S) def inf(rr) — {s | s — s{ pt infinit de multi i} (multimea starilor care apar infinit de multe ori pe я-) я este echitabila = ?Pt F inf(rr) nP (я trece infinit de multe ori prin orice multime din F) Notam |=F relatia de satisfacere cu fairness Clauze modificate in semantica CTL: M,s |=fp exista o traiectorie echitabila plecand din s si p € L(s) M,s |=f Eg o 3 traiectorie echitabila я din s cu M,я g M,s =pAg vv V traiectoriile echitabile я din s, M,я |=p g Verificare formala Curs 2 Marius Minea Fiind date o structura Kripke Л  — (S,So, R, L) si o formula f in logica temporala, sa se gaseasca starile din S care satisfac f: {s € S i M, s |=  } Specificatia e satisfacuta daca toate starile initiale satisfac f: Vs0 e s0 m, s0 |= f - independent, Clarke & Emerson, resp Quielle & Sifakis (1981) - initial: iO4-iO5 stari Actualmente, simbolic: cca iO100 stari - Descompunere dupa structura formulei f Pentru fiecare s e S, calculeaza Z(s) — multimea subformulelor lui f valabile in s -initial Z(s) — L(s) Trivial pentru conectorii logici v,л - EX : se eticheteaza orice stare cu un succesor etichetat cu f - Ceilalti operatori de baza: EU si EG Verificare formala Curs 2 Marius Minea Model Checking Notiuni de baza Model Checking Notiuni de baza 22 E [Ji U  2]: traversare inapoi pornind de la  2, cat timp se satisface Д procedure CheckEU(J , f2) Г := {s | 2 € i(s)} foraiiseT doz(s) ^(ЫЩЕйад; while T Ф 0 do choose s e T; T:=T  {s}: forall sj R(s!,s) do if E [h U  2]   i(si) A il e l{si) then Z(si) T :=TU{si}; Verificare formala Curs 2 Marius Minea EG : se considera doar statele care satisfac   Se traverseaza inapoi pornind de la componentele puternic conectate (SCC) procedure CheckEG(J') S" := {8 |   e ((s)}; SCC {C | С e o SCC netriviala in 5"}; T := U f(x) C f(y), ceea ce implica faptul ca proprietatile calculate se modifica in mod monoton Def: pentru o functie f: o valoare x pt care f(x) — x Teorema lui Tarski garanteaza ca o functie monotona pe o latice completa are un punct fix minimal si un punct fix maximal Algoritmul worklist calculeaza punctul fix minimal dat fiind sistemul de functii de transfer Analiza programelor Curs 2 Marius Minea Dorim sa calculam efectul combinat al instructiunilor programului: pentru p — siS2 sn sir de instructiuni definim F(p) — F(sn) °      ° T(s2) ° P(si) si dorim sa calculam: Fp(entry) Dar algoritmul iterativ combina efectele la fiecare punct de intalnire inainte de a calcula mai departe Functiile f fiind monotone, avem: f(x u y) □ f(x) u f(y) deci analiza pierde din precizie Pentru functiile de transfer distributive avem chiar: f(x) и f(y) — и у) Se demonstreaza ca in acest caz algoritmul iterativ (care genereaza o solutie de punct fix) e echivalent cu calculul solutiei prin combinarea valorilor pe toate caile posibile (meet over all paths) => combinarea diverselor cai de executie nu pierde informatie Cele 4 exemple date (live variables, etc ) sunt distributive Analiza programelor Curs 2 Marius Minea Analiza fluxului de date 11 Analiza fluxului de date 12 -inainte sau inapoi - must sau may - dependente sau independente de fluxul de control (flow (in)sensitive): Trebuie luata in considerare ordinea instructiunilor in program - nu: ce variabile sunt folosite modificate, functii apelate, etc - da: proprietati legate de valorile calculate efective de program - dependente sau independente de context in cazul programelor ce contin proceduri: e specializata analiza fiecarei proceduri in functie de locul de apel, sau se poate face un sumar (o analiza comuna) ? Modelarea programelor cu proceduri: in graful de flux de control, un - muchie de la locul de apel la inceputul procedurii - muchie de la sfarsitul procedurii la instructiunea de dupa apel in felul acesta, se obtin toate caile, dar si cai nefezabile t se restrange analiza asupra cailor realizabile, in care apelurile si reintoarcerile din functii sunt imperecheate corect Analiza programelor Curs 2 Marius Minea Analiza programelor Curs 2 Marius Minea Analiza fluxului de date 13 Analiza fluxului de date 14 [Reps, Horwitz, Sagiv ’95] - pentru un subset de probleme de analiza de flux de date (interprocedural, finite, distributive subset problem) [Das, Lerner, Seigle ’02 - Microsoft + U Washington] - o analiza statica (property simulation) scalabila la n   100 kloc - exemplu: absenta de erori in > 600 apeluri de sistem pentru 15 pointeri de fisiere in codul gcc (140 kloc) - prin analiza hibridaintre o analiza standard de flux de data (imprecisa) si analiza dependenta de cale (path-sensitive, prea costisitoare) - pastrand corelarea dintre starea proprietatii analizate (ex uninit, open, closed pentru fisier) si variabilele relevante din program) if (dump) f = fopen(dumpFil "w"); if (p) x = 0; else x = 1; if (dump) fclose(f); Analiza programelor Curs 2 Marius Minea Analiza programelor Curs 2 Marius Minea Programarea calculatoarelor Recursivitate Marius Minea 4 martie 2008 #include int sqr(int x) { printf("Patratul lui %d e %d n", x, x*x); = (ж ж2)2 return x * x; in ce ordine se scrie pe ecran ? int main(void) { printf ("2 la a 6-a e 7 d n", Patratul lui 2 e 4 sqr(2 * sqr(2))); Patratul lui 8 e 64 return 0; 2 la a 6-a e 64 } in C, transmiterea parametrilor la functii se face - se (calculeaza valoarea) toate argumentele functiei - valorile se atribuie la (numele din def fct ) - apoi se incepe executia functiei cu aceste valori Programarea calculatoarelor Curs 2 Marius Minea Programarea calculatoarelor Curs 2 Marius Minea Programarea calculatoarelor Recursivitate Programarea calculatoarelor Recursivitate in exemplu: programul incepe cu executia lui main, deci tiparirea printf - printf are nevoie de valoarea argumentelor sale Prima se stie (o ), a doua trePuie calculata' sqr(2 * sqr(2)) - pentru a efectua apelul exterior al lui sqr trePuie stiut argumentul, adica 2 * sqr(2) Deci se efectueaza intai apelul interior, sqr(2) =t> ordinea: sqr(2), apoi sqr(8), apoi printf din main Cum s-ar mai putea altfel, dar in C: : functia incepe executia si Tsi calculeaza argumentele la nevoie - printf ar tipari intai 2 la puterea 6 e, apoi il trePuie valoarea - ar apela sqr exterior care scrie Patratul lui, apoi il trePuie x - ar apela sqr(2) care scrie Patratul lui 2 e 4, returneaza 4, etc : se suPstituie argument pentru parametrii functiei - din printf s-ar apela sqr exterior cu 2 * sqr(2) - pt a calcula (2*sqr(2))*(2*sqr(2)) s-ar apela sqr(2) de doua ori a-inC, o functie calculeaza numai cu , niciodata cu Programarea calculatoarelor Curs 2 Marius Minea Recursivitatea e un concept fundamental in matematica si informatica Un oPiect (notiune) e recursiv(a) daca e folosit in propria sa definitie Exemplu din matematica: siruri recurente: - progresie aritmetica: xq = a, - progresie geometrica: rp = b, s a m d : comPinari C^, sirul lui xn = жп і + p, pentru n > 0 Xn = a   Xn-l, pentru n > 0 FiPonacci, Alte exemple: - oPlecte definite recursiv: un sir e un singur element, sau un element urmat de un sir ex : cuvant (sir de litere); numar (sir de cifre zecimale) - actiuni definite recursiv: un drum e un pas, sau un drum urmat de inca un pas (de exemplu o caleintr-un graf) Programarea calculatoarelor Curs 2 Marius Minea Programarea calculatoarelor Recursivitate Programarea calculatoarelor Recursivitate #include float pwr(float x, unsigned n) { return n==0 ? 1 : x * pwrfx, n-1); i int main(void) { printf("-2 la 3 = %f n", pwr(-2 0, 3)); return 0; i - tipul unsigned reprezinta intregi tara semn (numere naturale) - antetul functiei reprezinta o declaratie a ei, deci poate fi folosita in orice punct ulterior (inclusivin propriul corp - cazul apelului recursiv) - chiar daca scriem putere(-2, 3), -2 va fi convertit la real, intrucat se cunoaste tipul necesar pentru fiecare parametru Functia pwr face doua calcule: - un test (n == o ? a ajuns la cazul de baza ?) daca da, return 1 - daca nu, o inmultire', pt operandul drept trebuie un nou apel, recursiv pwr(5, 3) apel   '|'125 5* pwr (5, 2) apel   '|'25 5 * pwr (5, 1) apel   '1'5 5* pwr(5, 0) apel   il 1 Programarea calculatoarelor Curs 2 Marius Minea Programarea calculatoarelor Curs 2 Marius Minea Programarea calculatoarelor Recursivitate Programarea calculatoarelor Recursivitate Remarcam, executand pas cu pas, si urmarind figura: - fiecare apel genereaza "in cascada" un alt apel, pana la cazul de Paza - cand se ajunge la cazul de Paza, toate apelurile sunt incepute sl inca neterminate - fiecare apel Tsi urmeaza propria executie prin corpul functiei si are propriile valori pentru parametri 1 cazul de Paza (conditia de oprire) - cel mai simplu caz pentru definitia (notiunea) respectiva Exemple: termenul initial dintr-un sir recurent cel mai mic oaiect (un element, in cazul sirului) cea mai simpla actiune (un pas, in cazul drumului) 2 relatia de recurenta - defineste notiunea, folosind un caz mai simplu al aceleiasi notiuni 3 demonstratie (argument) de oprire a definitiei dupa nr finit de pasi (ex o cantitate nenegativa care descreste urmarind definitia) - pentru siruri: indicele (scade in definitie, e nenegativ) - pentru oaiecte: dimensiunea (la fel, scade) Programarea calculatoarelor Curs 2 Marius Minea Programarea calculatoarelor Curs 2 Marius Minea Programarea calculatoarelor Recursivitate Programarea calculatoarelor Recursivitate xn- -l — 2 • Xn - xn = — 3 - ап = а   а     а (de n ori) - o fraza e o insiruire de cuvinte - un sir e un sir mai mic urmat de un alt sir mai mic - un sir e un caracter urmat de un sir O definitie recursiva treauie sa fie bine formata (v conditiile 1-3) - ceva nu se poate defini doar in functie de sine insusi (x =  (x)) - se pot utiliza doar notiuni deja definite - nu se poate genera un calcul infinit (treauie sa se opreasca) unsigned cmmdc(unsigned a, unsigned b) { return a == b ? a : a > b ? cmmdc(a-b, b) cmmdc(a, b) = • cmmdc (a, b-a); {а a = b У cmmdc(a - b,b} a>b int main (void) { anwdc(a,b-a) a b ? cmmdc(a-b, b) : cmmdc(a, b-a); Programarea calculatoarelor Curs 2 Marius Minea Programarea calculatoarelor Curs 2 Marius Minea Programarea calculatoarelor Recursivitate Programarea calculatoarelor Recursivitate 12 unsigned fact1(unsigned n) { return n == 0 ? 1 : n * factl(n-l); }    varianta 2: apelata cu fact2(n, 1) unsigned fact2(unsigned n, unsigned res) { return n == 0 ? res : fact2(n-l, n*res); } v l: calcul facut la sfarsitul functiei, revenirea din apelul recursiv calcule succesive: 1*1 (1), 2*1 (2), 3*2 (6), 4*6 (24), 6*24 (120), etc v 2: functia primeste un rezultat partial, care e actualizat prin calcul si transmis mai departe (calcul de apelul recursiv); ajuns la cazul de baza, rezultatul e complet si e returnat pana sus apeluri (arg 2): 1, 5 (6*1), 20 (4*6), 60 (3*20), 120 (2*60), 120 (1*120) Programarea calculatoarelor Curs 2 Marius Minea factl(3) ape!  )6 3 * factl(2) ape  | '|'2 2 * factl(l) apelJ il 1 * factl(0) apelJ il 1 - apelul se face in calculul rezultatului -inmultirea: dupa revenirea din apel calcul: 3*(2*(1*1)) fact2(3, 1) apel  (6 fact2(2, 3) apel  (6 fact2(l, 6) apel  (6 fact2(0, 6) apel  (6 6 - calculul: inainte de apel (valoarea pt param, doi, cu rol de rezultat partial) - la revenire: se transmite rezultatul inapoi pana sus calcul: (((1*3)*2)*1) Programarea calculatoarelor Curs 2 Marius Minea Programarea calculatoarelor Recursivitate 13 Forma: sq = to, sn = s" i + in, pentru n > 0 (in = termenul general) Exemplu recursiv pentru seria armonica 1 1 + 1 2 + + 1 n #include double suma rec(unsigned n) { return n == 0 ? 0 : suma rec(n-1) + 1 0 n; } int main(void) { printf("suma pana la 1 100: 7,f n", suma rec(100)); return 0; } - am transcris direct definitia recursiva sq = to, sn = sn^i + l n (n > 0) termenii se aduna incepand de la 1 1 la 1 100, la revenirea din apel -double: tip pentru numele realein duPla precizie (tipul implicit pentru constante reale, folosit uzual in calcule, si in functiile standard) - tiparire cu formatul 7 f (printf converteste si pe float la double) 1 0   n : operatie intre real si intreg : intregul convertit la real Programarea calculatoarelor Curs 2 Marius Minea Programarea calculatoarelor Recursivitate 14 Putem rescrie, ca si la fact2, transmitand mai departe suma partiala (calculata tot pornind invers, de la termenul de ordin cel mai mare) double suma inv(unsigned n, double rez) { return n == 0 ? rez : suma inv(n - 1, rez + 1 0 n); } suma inv(n, rez) e suma primilor n termeni (inca necalculata), plus rezultatul rez deja calculat al termenilor din dreapta celui curent (in) - daca n = 0, totul e adunat deja in rez, care e returnat; - altfel, rezultatul e acelasi cu suma primilor n-1 termeni (inca necalculata), plus rezultatul partial la care se adauga 1 n (termenul curent) Pentru calcul, se apeleaza cu rezultatul initial o : suma inv(ioo, o o) Pentru a simplifica folosirea de catre utilizator, se poate defini o functie cu un singur parametru, care o apeleaza pe aceasta ca functie auxiliara: double serie annonica(unsigned n) { return suma inv(n, 0 0); } Programarea calculatoarelor Curs 2 Marius Minea Programarea calculatoarelor Recursivitate Programarea calculatoarelor Recursivitate 16 Putem exprima recursiv calculele numerice cu aproximatii succesive Cazul de Paza (oprirea) inseamna aici atingerea unei precizii suficiente, -pentru radacina patrata Уж avem: double rad(double x, double a n) { return fabs(a n - x a n) #include double e x(double x, unsigned n, double s n 2, double t n l) { return fabs(t n l) set de valori (chiar daca in matematica, domeniile pentru intregi si reali sunt nelimitate) => Atentie la depasiri !!! Limbajul C are doar cateva tipuri de baza - char: caractere, reprezentate pe 1 octet (8 biti) - int: numere intregi - float: numere reale (virgula mobila), in precizie simpla - double: numere reale, in dubla precizie Domeniul de valori pentru intregi si reali e dependent de arhitectura (de obicei, corespunde natural cu dimensiunea registrilor procesorului) Programarea calculatoarelor 2 Curs 2 Marius Minea Tipuri Operatori Expresii Tipuri Operatori Expresii Tipul int poate primi ca prefix calificatori care specifica: - : short, long (in C99 si long long) - : signed (implicit, in caz de omisiune), unsigned Cele doua se pot combina; int poate fi omis: (ex unsigned short) Standardul prevede (definitii in - int, short: > 2 octeti, minim [—215, 215 - 1] = [-32768, 32767] - long: > 4 octeti, acopera minim [-231 (-2147483648) , 231 - 1] - long long: > 8 octeti, acopera minim [—263, 263 - 1] - unsigned pastreaza dimensiunea; intre 0 si 281' - 1 (6 = nr octeti) - sizeof(short) domeniul de valori e simetric fata de zero => precizia se defineste relativ la modulul numarului Exemple de dimensiuni (compilator gcc pe І386, sub Linux): - float: 4 octeti, intre cca iO-38 si iO38, 6 cifre semnificative - double: 8 octeti, intre cca iO-308 si io308, 15 cifre semnificative - pentru precizie suplimentara: long double (12 octeti) - contin mantisa, iar optional semn si exponent (prefix e sau E) -in mantisa, partea reala sau zecimala poate lipsi, dar nu amandoua - implicit, orice constanta reala e considerata double - sufix f sau F pentru float; 1 sau L pentru long double Exemple: 1 0 sau 1 sau lei 3 14159265358979323846 1 175494e-38f Programarea calculatoarelor 2 Curs 2 Marius Minea Tipuri Operatori Expresii Tipuri Operatori Expresii 10 : valori minime cerute de standard SHRT MiN, iNT MiN -32767 LONG MiN -2147483647 USHRT MiN, UiNT MiN 65535 SHRT MaX, iNT MaX 32768 LONG MaX 2147483647 ULONG MaX 4294967295 Obs: pe gcc i386 Linux, int are aceleasi dimensiuni ca si long : valori pt gcc i386 Linux (si cerintele standard) FLT DiG 6 DBL DiG 15 (min 10)  * precizie zecimala *  FLT MiN 1 17549435e-38F (max 1E-37) FLT MaX 3 40282347e+38F (min 1E+37) FLT EPSiLON 1 19209290e-07F (max 1E-5)  * nr min cu 1+eps > 1 *  DBL MiN 2 2250738585072014e-308 (max 1E-37) DBL MAX 1 7976931348623157e+308 (min 1E+37) DBL EPSiLON 2 2204460492503131e-16 (max 1E-9) - int (chiar long): domeniu de valori mic (cca ± 2 miliarde) - e insuficient pentru multe calcule care implica aparent intregi Ex calculati e x = 1 - ж1 !! + r-2 21 - cu o precizie data (iO-5) Nu incercati: long fact (long n)} {  * *  } (depasire pt n > 12) mai bine: fara factorial, cu recurenta intre termeni: in = in i * x n - pana la 9E15 tipul double distinge inca doi intregi consecutivi - o valoare citita de la intrare nu e reprezentata neaparat precis! float x; scanf ("7,f", ftx); printf ("7 7f", x); 4 2 > 4 1999998 fractii exacte in baza 10 pot fi periodice in baza 2 1 2(10j = l (0011)(2) -in calcule matematice, adeseori comparatia == e insuficienta (pot apare pierderi de precizie pe parcurs) - mai bine: fabs(x - y) 1 Programarea calculatoarelor 2 Curs 2 Programarea calculatoarelor 2 Curs 2 Marius Minea Tipuri Operatori Expresii 11 Tipuri Operatori Expresii 12 Operatorul sizeof da numarul de octeti de memorie ocupati de operand (un tip de date sau o expresie - in particular o variabila) - daca operandul e un tip, trebuie pus intre ( paranteze ) - daca e o expresie, rezultatul e dat de tipul sau (fara evaluarea ei) #include void main (void) printf("char t t%d n",sizeof(char)); printf("short t t%d n",sizeof(short)); printf("int t t%d n",sizeof(int)); printf("long t t%d n",sizeof(long)); printf("float t t%d n",sizeof(float)); printf("double t t%d n",sizeof(double)); printf("long double t%d n",sizeof(long double)); Programarea calculatoarelor 2 Curs 2 Marius Minea -operatorii uzuali binari: +, -, *,   pentru numere intregi si reale ATENtiE: pentru intregi,   inseamna impartire cu rest - operatorul 7 (numai pentru intregi): modulo (restul la impartire) 9 -5==-l 97 -5==4 -9 5=-l -97 5==-4 -9 -5=l -97 -5=-4 (restul are semnul deimpartitului) - operatorul unar - (minus; nu exista plus unar) in expresii aritmetice, caracterele sunt considerate ca si intregi (indicele caracterului respectiv in tabela ASCii) Exemplu: ’7’ - ’0’ == 7, ’a’ + 5 == ’f’ (cifrele, respectiv literele ocupa spatiu continuu in tabela de caractere) Precedenta: - unar, apoi *,  , 7 , apoi +, - Programarea calculatoarelor 2 Curs 2 Marius Minea Tipuri Operatori Expresii - C nu are tip boolean; se foloseste int (C99: Booi, stdbool h) - operatorii logici produc 1 pt true, 0 pt false - un intreg e interpretat ca true daca e st 0 si ca false daca e 0 : precedenta mai mica decat cei aritmetici x , >=, se poate scrie natural (x determina semnul caracterelor cu bitul 7 pe 1, si implicit semnul la conversia char -> int la conversia comparatia intre int si unsigned i! valorile > int max sunt considerate negative ca int => rezultate incorecte   surprinzatoare   neintuitive int 1; unsigned u = 3000000000;  * u > iNT MaX *  i = u + 5;  * bitul de semn 1, deci i e considerat negativ *  if (i > u) printf ("7,d > 7,u n", i, u);  * tipareste: -1294967291 > 3000000000 ii! *  Pentru a compara int i cu unsigned u -inlocuiti (i u) cu (i > 0 && i > u) Programarea calculatoarelor 2 Curs 2 Marius Minea : partea dreapta convertita la tipul partii stangi - e posibila trunchierea daca atribuim la un tip de dimensiune mai mica mesaje de avertizare de la compilator Exemplu: int i; char c; i = c; c = i;  * valoarea se pastreaza *  c = i; i = c;  * bitii superiori se pierd *  : partea dreapta e evaluata independent de tipul partii stangi! unsigned eur rol = 41000, usd rol = 33500; float eur usd; eur usd = eur rol   usd rol;  * 1 !!! *  (engl type cast) Sintaxa: ( nume tip ) expresie expresia este convertita ca in atribuirea unei variabile de tipul dat eur usd = (double) eur rol   usd rol;  * 1 17 *  int n; sqrt((double)n);  * double sqrt(double) in math h *  Programarea calculatoarelor 2 Curs 2 Marius Minea Tipuri Operatori Expresii Tipuri Operatori Expresii 18 propriu-zisa: var = expr (un operator ca oricare altul) => o expresie de atribuire poate fi folosita in alta expresie compusa (si valoarea ei e chiar cea a expresiei atribuite) a = b = c  * asociativ la dreapta, a = (b = c) *  if ((c = getcharO) != ’ n’) {  * folosim rezultatul in test *  } : Nu gresiti folosind atribuirea in loc de test de egalitate!! if (x = y) testeaza daca valoarea lui у (atribuita si lui x) e nenula : += = *=  = • ,= x += expr e o forma mai scurta de a scrie x = x + expr vezi ulterior si pentru operatorii pe biti " " &   | prefix postfix: ++ — ++i incrementare cu 1, valoarea expresiei este cea de dupa atribuire i++ incrementare cu 1, valoarea expresiei este cea dinainte de atribuire int x=2, y, z; у = x++;  * y=2,x=3 * ; z = ++x;  * x=4,z=4 *  Programarea calculatoarelor 2 Curs 2 Marius Minea - numara caracterele din sirul s in variabila i for (i = 0; s[i] != ЛОО i++);  * sirul se termina cu ’ 0’ *! sau, cu un test implicit de valoare nonzero, si preincrement: for (i = -1; s[++i]; );  * corpul lui for este vid *  - copiaza sirul src in sirul dest; expresia atribuita serveste si pt test for (i = j = 0; dest[j++] = src[i++]; ); - copiaza max N caractere; cand primul test e fals, se omite al doilea (deci nu se mai executa atribuirea) for (i = j = 0; i o expresie care contine mai multi operatori cu efect lateral poate avea rezultat   efect nedeterminat Exemple eronate: int i = 0; printf ("7,d 7 d", i++, i++);  * *01 sau 1 0 * ); (argumentele unei functii se pot evalua in orice ordine) while (s[i] b) ? a : b;  * max(a, b) *  printf("Numarul este 7 s n", (n -4 i ++ — - ( tip) * & (pt adrese) sizeof void main(void) int a, b, c; printf("introduceti trei numere intregi a b c: "); scanf ("7 d * ,d 7,d", &a, &b, &c);  * sau * ,d* ,d* ,d (la fel) *  printf("Cel mai mic numar este "); if (a  * functii matematice *  #include void main(void) float a, b, c, bl, d, delta; printf("Coeficientii ecuatiei: ");  * ax"2+bx+c=0 *  scanf ("7 f7 f7 f" , &a, &b, &c); bl = -b (2 0*a); delta = bl*bl - c a; if (delta == 0) printf("Solutie dubla: 7"f n", bl); else if (delta > 0) { d = sqrt(delta);  * radacina patrata *  printf ("Solutii: % lf si % lf n", bl+d, bl-d); } else  * delta 0 int n, p, x; p = 1;  * valoarea initiala, x la puterea 0 *  while (n > 0) {  * n = de cate ori mai trebuie inmultit cu x *  p = p * x;  * facem inmultirea *  n = n - 1;  * a ramas cu o inmultire mai putin de facut *  Utilizarea si programarea calculatoarelor Curs 2 Marius Minea Utilizarea si programarea calculatoarelor Curs 2 Marius Minea introducere in limbajul C introducere in limbajul C do instructiune  * poate fi { compusa } *  while ( expresieJogica ); - se executa instructiunea - se evalueaza expresia - daca expresia e adevarata, se revine la executia instructiunii - daca expresia e falsa, ciclul se incheie Exemplu: char raspuns; do { printf("Apasati ’d’ pentru a continua: "); scanf (" 7,c", feraspuns);  * citeste caracter, sare peste spatii *  } while (raspuns != ’d’);  * pana la raspunsul dorit *  Obs: in Pascal, din repeat untii se iese pe conditie true (invers!) Utilizarea si programarea calculatoarelor Curs 2 Marius Minea exp mit; while (exp-test) { instructiune; exp cont; } P = 1; while (n > 0) { p = p * x; n = n - 1; for (expJnit ; exp test ; exp cont) instructiune e echivalenta* cu: * exceptie: instructiunea continue, vezi ulterior Calculul puterii: for (p=l;n>0;n=n-l) p = p * x; - oricare din cele 3 expresii poate lipsi (dar cele doua ; raman) - daca exp test lipseste, e tot timpul adevarata (ciclu infinit) Cel mai simplu si frecvent caz: cand stim numarul de iteratii: int i;  * variabila cu care numaram iteratiile *  for (i = 0; i 0);  * i e numarul de cifre *  do { i = i - 1;  * prima cifra e la pozitia i - 1 *  printf("%d", cifre [i]); }• while (i > 0);  * ultima cifra e la pozitia 0 *  Exista tablouri de oricate dimensiuni Pentru 2: matrici: int m ; interpretare: tablou de 10 elemente, fiecare un tablou de 7 intregi void main(void) { int i, j, m , sumcol ;  * matrice si suma pe coloane *  printf("Dati pe linii si coloane o matrice 5x3 de intregi n"); for (i = 0; i    daca citim sau scriem ceva #include    daca folosim functii matematice    definitie de functie: latura opusa unghiului double latura3(unsigned a, unsigned b, double alfa)    expresia contine apeluri la alte 2 functii: cos, sqrt return sqrt(a*a + b*b - 2*a*b*cos(alfa)); int main(void)    apel de functie cu valori pt param ; scrie rezultatul printf("Latura a 3-a: %f n", latura3(3, 5, atan(l))); return 0; Recursivitatea = reducere la e asa de simplu incat (poate fi calculat direct) problema, dar caz nu mai trebuie redus n = 0 n = 1 n > 1 par n > 1 impar double pow2(double x, unsigned n) return n double pow2(double x, unsigned n) printf("baza %f la %u n", x, n); return n 1 + piog2 nj apeluri pow2(5, 6) —>pow2(25, 3) —> pow2 (625, 1) —> pow2 (625, 0) 1 ( necesita apel recursiv) = cel mai simplu caz pentru definitia (notiunea) data, definit direct termenul initial dintr-un sir recurent: xq un element, in definitia: sir = element sau sir + element E o daca lipseste cazul de baza (apel recursiv infinit!) 2 propriu-zisa -defineste notiunea, folosind un caz mai simplu al aceleiasi notiuni 3 Demonstratie de dupa numar finit de pasi (ex o marime nenegativa care descreste cand aplicam definitia) - la siruri recurente: indicele (> 0 dar mai mic in corpul definitiei) - la obiecte: dimensiunea (definim obiectul prin alt obiect mai mic) ? xn+1 = 2   xn ? xn = xn | i 3 ? an = a   a     a (de n ori) ? o fraza e o insiruire de cuvinte ? un sir e un sir mai mic urmat de un alt sir mai mic ? un sir e un caracter urmat de un sir 0 definitie recursiva trebuie sa fie bine formata (v conditiile 1-3) ceva nu se poate defini doar in functie de sine insusi se pot utiliza doar notiuni deja definite nu se poate genera un calcul infinit (trebuie sa se opreasca) Din matematica: ao = 1, an+i = |(an + ^-) sirul aproximatiilor e problema e natural recursiva ce se da (parametri): x si aproximatia curenta ce se cere = o aproximatie suficient de buna (precizie e) Formulam problema: calculeaza л х stiind aproximatia curenta an Modul de calcul: la precizie buna |an+i —an|    pentru declaratia double fabs(double x) ; (val abs real)    radacina lui x cu eroare b ? a : b; } unsigned maxcifra(unsigned n) return n 0x40: © A В C D E F G H i J К L M N 0x50: P Q R S T U V W X Y Z [   ] ** 0x60: c a b c d e f g h i j к 1 m n 0x70: p q r s t u V w X У z 1 Prefixul denota (in baza 16) Caracterele poate fi memorat pe (8 ) Cf standard: char poate fi , de la -128 la 127, sau , de la 0 la 255 Ambele sunt incluse in int in program, se scriu intre ’ ’ Au valori intregi (cod ASCii) in calcul: convertite automat la int Cifrele, literele mici si literele mari sunt avem: ’7’ == >o> + 7 ’5’ - ’0’ == 5 ’E’ - ’A’ == 4 ’f’ == ’a’ + 5 Reprezentari pentru caractere speciale:  0’ nuli ’ n’ linie noua  a’ alarm ’ r’ carriage return  b’ backspace ’ f ’ form feed  t ’ tab a postrof  v ’ vertical tab ’W backslash functiei, in stdio,h : int getchar(void); functiei: getcharO fara parametri, dar cu O Returneaza codul ASCii ca unsigned char convertit la int, sau returneaza valoarea EOF daca nu s-a citit un caracter (la sfarsit de fisier, end-of-file) E nevoie ca getcharO sa returneze int si nu char pentru a putea exprima si constanta EOF (-1, diferita de orice unsigned char) La tastatura, caracterele sunt introduse cu ecou, intr-un tampon, programul le preia (ex cu getcharO) doar dupa tastarea Enter ATENtiE! Programul nu are control asupra datelor de intrare! => trebuie si tratate erorile functiei, in stdio,h : int putchar(int c); functiei (exemplu): putchar(’7’) un unsigned char (dat ca int); returneaza valoarea scrisa #include int main(void) putchar(’A’); putchar(’:;    scrie A apoi : putchar(getcharO);    scrie caracterul citit return 0; } Folosim tot definitia recursiva a numarului, evidentiind ultima cifra Fie numarul C1C2 cm, si secventele partiale q, C1C2, C1C2C3, Avem: гр = 0, Гк = 10   r ( i + Ck, (k > 0) Definim recursiv o functie care calculeaza numarul pornind de la partea deja citita r ( i si cifra curenta Ck- - cand caracterul citit nu mai e cifra, numarul e gata format in r - altfel, continua recursiv de la 10 r + c, citind urmatorul caracter Atentie, getcharO returneaza codul ASCii, nu valoarea cifrei ajustam cu - ’ 0 ’, de ex 6 == ’ 6 ’ - ’ 0 ’ ctype h contine declaratiile functiilor de clasificare a caracterelor: isalpha, isalnum, isdigit, isspace, islower, isupper, etc Ele iau ca parametru un caracter si returneaza adevarat sau fals (caracterul e de tipul respectiv, sau nu) #include #include unsigned readnat rc(unsigned r, int c) return isdigit(c) ? readnat rc(10*r + (c-’O’), getcharO) : r; r: numarul deja acumulat, c: caracterul curent citit de la intrare Ca solutie finala, scriem o functie fara parametri auxiliari: int readnat(void) { return readnat rc(0, getcharO); } Scriem o functie care citeste un intreg, ce poate avea si semn:    functie auxiliara: c: primul caracter int readint c(int c) return c == ? - readnatO   c == ’ + ’ ? readnatO   readnat rc(O, c);    functia ceruta fara parametru int readint(void) { return readint c(getcharO); } int main(void) printf("numarul citit este: %d n", readint()); return 0; Un calcul pur nu are alte efecte: urmatorul program nu scrie nimic! int sqr(int x) { return x * x; } int main(void) { return sqr(2); } Apelul repetat al unei functii (in matematica, sau cele scrise pana acum: sqr, fact, etc ) cu aceiasi parametri da acelasi rezultat Tiparirea (printf) produce un efect vizibil (si ireversibil) Citirea cu getcharO returneaza la fiecare apel caracter din intrare; caracterul e O modificare in starea mediului de executie a programului se numeste (ex citire, scriere; atribuire (va urma)) Uneori e necesar sa memoram o valoare (caracter citit de la intrare, pentru a nu-l pierde; rezultat de functie, pentru a nu-l recalcula) Vom discuta cum se face aceasta prin unei intr-o functie: ce se da = parametrii; ce se cere = rezultatul Pentru rezultate valori intermediare Ex: citirea de numar: caract curent c nu e in enuntul problemei => e ceva ajutator, poate fi citit in functie Declaram o variabila: unsigned readnat r(unsigned r) { int c = getcharO;    declaram si initializam c return isdigit(c) ? readnat r(10*r + c - ’0’) : r; } 0 e un obiect cu un nume si un tip E utila la memorarea unor valori (altele decat parametrii de functie) necesare in calcule : una sau mai multe variabile de acelasi tip: double x; int a = 1, b, c; (a e initializat cu 1, restul nu) Declaram variabile cand e nevoie sa (de exemplu returnate de functii) pentru Un program C: o colectie de functii, fiecare rezolva o subproblema; programul principal main le combina (apeleaza functiile) Numele parametrilor unor functii diferite nu se influenteaza; ca si in matematica putem avea f(x) = si g(x) = la fel pentru variabilele declarate in functii ( ) al unui identificator (de ex variabila) = partea de program unde poate e cunoscut (si poate fi utilizat) Parametrii si variabilele declarate in functii au domeniul de vizibilitate corpul functiei nu sunt vizibile in exteriorul functiei Variabilele locale au automata: create la fiecare apel al functiei, distruse la incheierea acestuia (intre apeluri nu exista si deci nu isi pastreaza valoarea) Corpul { } unei functii С e o secventa de declaratii si instructiuni -in C99, declaratiile si instructiunile pot aparea in orice ordine -in standardele anterioare: intai declaratii, apoi instructiuni ? : selecteaza din doua selecteaza intre de evaluat de executat if expresie instructiunel else instructiune2 sau if expresie instructiunel Daca expresia e se executa instructiunel, altfel se executa instructiune2 (sau nimic, daca nu exista) Fiecare ramura are instructiune Daca sunt mai multe instructiuni, trebuie grupate intr-o { } din jurul conditiei sunt obligatorii Marius Minea marius@cs upt ro http:  www cs upt ro  marius curs f i 3 octombrie 2012 inversam lista : 1) separam capul listei Va fi ultimul element din lista rezultat lista ramasa: rezultat partial: 2) separam capul listei Se pune la inceputul listei rezultat lista ramasa: rezultat partial: 3) lista ramasa: [] rezultat partial: (final) in pasul 1), a crea lista e la fel cu a adauga 3 in fata listei vide [] let rev = let rec rev2 rs = function let rec rev2 rs = function i [] -> rs i [] -> rs i h :: t -> rev2 (h :: rs) t | h :: t -> rev2 (h :: rs) t let rev = rev2 [] in rev2 [] Varianta a 2-a "ascunde" definitia functiei ajutatoare rev2 care va fi vizibila doar in definitia lui rev, cu sintaxa let nume = expresie in expresie let rec nodup = function i hl :: (h2 :: as t) -> let rez = nodup t in if hl = h2 then rez else hl :: rez i ist -> ist Putem testa duplicate doar intr-o lista cu minim 2 elemente: tiparul hl : : h2 : : cand nu ne intereseaza o valoare, folosim tiparul Ultimul caz se potriveste pentru liste cu 0 sau 1 element (nu se schimba) Cu sintaxa tipar as nume putem folosim apoi nume pentru valoarea care s-a potrivit cu tiparul Pe liste se pot defini functii generice de prelucrare => putem itera prelucrari fara a scrie repetat acelasi cadru Modulul List din ML are astfel de functii: iter : (’a -> unit) -> ’a list -> unit iter f [al; a2; an] apeleaza f al; f a2; f an; () map : (’a -> ’b) -> ’a list -> ’b list map [al; a2; ; an] e lista [f al; f a2; f an] fold left : (’a -> ’b -> ’a) -> ’a -> ’b list -> ’a fold left f a [bl; b2; bn] = f ( f (fa bl) b2 ) bn fold right : (’a -> ’b -> ’b) -> ’a list -> ’b -> ’b fold right f [al; a2; ; an] b = f al (f a2 ( (f an b) )) filter f [al; a2; ; an] : elementele pentru care f e adevarata let rec iter f = function i [] -> O i h :: t -> (f h; iter f t) let rec map f = function i [] -> [] i h :: t -> f h :: map f t let rec fold left f a = function i □ -> a i h :: t -> fold left f (f a h) t let rec fold right f ist b = match ist with [] -> b i h :: t -> f h (fold right f t b) let filter f = function i [] -> [] i h :: t -> if f h then h :: filter f t else filter f t List iter print int tipareste 123 List map ((+) 2) are ca rezultat List fold left (+) 0 face suma elementelor: 14 Putem implementa inversarea rev cu fold left : let rev = List fold left (fun t h -> h :: t) [] Putem implementa minimul unei liste: let list min = function i [] -> invalid arg "empty list" (* exceptie *) i h :: t -> List fold left min h t partea mecanica de cea functionala (parcurgerea listei, care e standard, de prelucrarea specifica problemei) Nu necesita scrierea (repetata) a codului de parcurgere intentia prelucrarii poate fi scrisa mai clar (mai direct) Reduce probabilitatea erorilor la sfarsitul prelucrarii (lista vida) Ordinea operatiilor la fold left si fold right e diferita fold right: f al (f a2 ( (f an b) )) primul apel f al are nevoie de o valoare inca necalculata i h :: t -> f h (fold right f t b) pe rezultatul dat de instanta apelata mai trebuie un calcul f h rezultat e nevoie de inregistrarea pe stiva (valorile proprii ale parametrilor, etc) foidJeft: f (, f (fa bl) b2 ) bn primul apel: f a bl care e folosit ulterior i h :: t -> fold left f (f a h) t rezultatul returnat de instanta apelata e chiar cel dorit in instanta curenta fara calcule la revenire, se transmite doar rezultat mai sus => Recursivitatea e "la coada" prelucrarii (tail recursion) Necesita uneori rescrierea prelucrarii cu un acumulator let rec fact n = if n = 0 then 1 else n * fact (n-1) let rec fact2 n res = if n = 0 then res else fact2 (n-1) (n * res) (* lista numerelor de la a la b *) let rec fromto a b = if a > b then [] else a :: fromto (a+1) b let rec sieve = function i [] -> [] i h :: t -> h :: sieve (List filter (fun x -> x mod h <> 0) t) let primes = sieve (fromto 2 1000) 10 octombrie 2011 Recursivitatea nu e doar pentru siruri recurente Daca putem reduce o problema la un caz mai simplu (mai mic) al ei, putem exprima acest lucru e cel prea simplu ca sa il mai putem reduce Scriem o care returneaza raspunsul problemei Datele de care depinde problema devin functiei Reluam ca exemplu: calculul sumei intregilor intre a si b Cazul de baza: nu putem separa un numar (interval vid, a > b) sum all(a b) = a + sum all(a + 1, b) (daca a > b) int sum all(int a, int b) return a > b ? 0 : a + sum all(a+l, b); Din matematica: ao = 1, an+i = |(an + ^-) sirul aproximatiilor e problema e natural recursiva ce se da (parametri): x si aproximatia curenta ce se cere = o aproximatie suficient de buna (precizie e) Formulam problema: calculeaza л х stiind aproximatia curenta an Cazul de baza: la precizie buna |an+i — an|    pentru declaratia double fabs(double x) ; (val abs real) double rad(double x, double an) {    rad lui x, data aprox an return fabs(an - x an) 0 (in = termenul general, pentru care avem o formula) Exemplu pentru seria armonica (in = 1 n) sn = 1 1 + 1 2 + + 1 n recursiv: sp = 0, sn = sn i + 1 n pentru n > 0 in cuvinte: stim sa raspundem direct cat e so : 0 Nu putem calcula direct sn (pentru n > 0), dar daca aflam cat e sn i mai trebuie sa adunam 1 n Functia care calculeaza pe s(n) raspunde 0 daca n = 0 iar altfel, calculeaza s(n — 1), aduna 1 n si returneaza rezultatul #include double suma rec(unsigned n) { return n == 0 ? 0 : suma rec(n-1) + 1 0 n; } int main(void) { printf("suma pana la 1 100: %f n", suma rec(100)); return 0; } Termenii se aduna la revenirea din apel, de la 1 1 la 1 100 1 0   n : operatie intre real si intreg : intregul convertit la real : 1 n da valoarea 0 cand n > 1 (impartire intreaga) 1Т 1Т in sn = sn-i + 1 n, trebuie adunat 1 n, dar nu stim inca sn i folosim un rezultat partial rez la care adunam 1 n apelam recursiv cu valoarea rez + 1 0 n double suma inv(unsigned n, double rez) { return n == 0 ? rez : suma inv(n - 1, rez + 1 0 n); Cand n = 0, totul e adunat deja in rez, care e returnat ca rezultat in apelul initial, rezultatul acumulat e zero: suma inv(100, 0 0) rez e o valoare auxiliara, nu face parte din enuntul problemei Definim o functie cu un singur parametru, care apeleaza suma inv double serie armonica(unsigned n) { return suma inv(n, 0 0); } Calculam sn = sn-i + in (n > 0), cu so = 0 pana cand valoarea absoluta a termenului in = xn n  e neglijabila Gandim recursiv: calculul , data fiind sn— 1- - daca termenul in e suficient de mic, returnam suma curenta - altfel: apel recursiv, calculam de la sn i + in Exemplu: seria 1 + 1 22 + 1 32 + = 7г2 б in = 1 n2 (n > 0): double sum 2(unsigned n, double s n l) { return l  n n b ? a : b; } unsigned maxcifra(unsigned n) { return n 0x40: © A В C D E F G H i J К L M N 0x50: P Q R S T U V W X Y Z [   ] ** 0x60: c a b c d e f g h i j к 1 m n 0x70: p q r s t u V w X У z 1 Prefixul denota (in baza 16) Caracterele poate fi memorat pe (8 ) Cf standard: char poate fi , de la -128 la 127, sau , de la 0 la 255 Ambele sunt incluse in int in program, se scriu intre ’ ’ Au valori intregi (cod ASCii) in calcul: convertite automat la int Cifrele, literele mici si literele mari sunt avem: ’7’ == >o> + 7 ’5’ - ’0’ == 5 ’E’ - ’A’ == 4 ’f’ == ’a’ + 5 Reprezentari pentru caractere speciale:  0’ nuli ’ n’ linie noua  a’ alarm ’ r’ carriage return  b’ backspace ’ f ’ form feed  t ’ tab a postrof  v ’ vertical tab ’W backslash functiei, in stdio,h : int getchar(void); functiei: getcharO fara parametri, dar cu O Returneaza codul ASCii ca unsigned char convertit la int, sau returneaza valoarea EOF daca nu s-a citit un caracter (la sfarsit de fisier, end-of-file) E nevoie ca getcharO sa returneze int si nu char pentru a putea exprima si constanta EOF (-1, diferita de orice unsigned char) La tastatura, caracterele sunt introduse cu ecou, intr-un tampon, programul le preia (ex cu getcharO) doar dupa tastarea Enter ATENtiE! Programul nu are control asupra datelor de intrare! => trebuie si tratate erorile functiei, in stdio,h : int putchar(int c); functiei (exemplu): putchar(’7’) un unsigned char (dat ca int); returneaza valoarea scrisa #include int main(void) { putchar(’A’); putchar(’:’);    scrie A apoi : putchar(getcharO);    scrie caracterul citit return 0; } Folosim tot definitia recursiva a numarului, evidentiind ultima cifra Fie numarul C1C2 cm, si secventele partiale q, C1C2, C1C2C3, Avem: ro = 0, Гк = 10   Гк-і + Ck, {к > 0) Definim recursiv o functie care calculeaza numarul pornind de la гіл   si cifra curenta Ck’- - cand caracterul citit nu mai e cifra, numarul e gata format in r - altfel, continua recursiv de la 10   r + c, citind urmatorul caracter Atentie, getcharO returneaza codul ASCii, nu valoarea cifrei ajustam cu -’0’, de ex 6 == ’6’ - ’0’ ctype h contine declaratiile functiilor de clasificare a caracterelor: isalpha, isalnum, isdigit, isspace, etc Ele iau ca parametru un caracter si returneaza adevarat sau fals (caracterul e de tipul respectiv, sau nu) #include #include unsigned readnat rc(unsigned r, int c) { return isdigit(c) ? readnat rc(10*r + (c-’O’), getcharO) : r; r: numarul deja acumulat, c: caracterul curent citit de la intrare Ca solutie finala, scriem o functie fara parametri auxiliari: int readnat(void) { return readnat rc(0, getcharO); } Scriem o functie care citeste un intreg, ce poate avea si semn:    functie auxiliara: c: primul caracter int readint c(int c) return c == ? - readnatO   c == ’ + ’ ? readnatO   readnat rc(O, c);    functia ceruta fara parametru int readint(void) { return readint c(getcharO); } int main(void) printf("numarul citit este: %d n", readint()); return 0; Un calcul pur nu are alte efecte: urmatorul program nu scrie nimic! int sqr(int x) { return x * x; } int main(void) { return sqr(2); } Apelul repetat al unei functii (in matematica, sau cele scrise pana acum: sqr, fact, etc ) cu aceiasi parametri da acelasi rezultat Tiparirea (printf) produce un efect vizibil (si ireversibil) getcharO returneaza caracter din intrare la fiecare apel; caracterul e O modificare in starea mediului de executie a programului se numeste (ex citire, scriere, atribuire - v ulterior) Uneori e necesar sa memoram o valoare (caracter citit de la intrare, pentru a nu-l pierde; rezultat de functie, pentru a nu-l recalcula) Vom discuta cum se face aceasta prin unei intr-o functie: ce se da (parametrii); ce se cere (rezultatul) Pentru rezultate valori intermediare Ex: citirea de numar: caract curent c nu e in enuntul problemei => e ceva ajutator, poate fi citit in functie Declaram o variabila: unsigned readnat r(unsigned r) { int c = getcharO;    declaram si initializam c return isdigit(c) ? readnat r(10*r + c - ’0’) : r; } 0 e un obiect cu un nume si un tip E utila la memorarea unor valori (altele decat parametrii de functie) necesare in calcule : una sau mai multe variabile de acelasi tip: double x; int a = 1, b, c; (a e initializat cu 1, restul nu) Declaram variabile cand e nevoie sa (de exemplu returnate de functii) pentru Un program C: o colectie de functii, fiecare rezolva o subproblema; programul principal main le combina (apeleaza functiile) Numele parametrilor unor functii diferite nu se influenteaza; ca si in matematica putem avea f(x) = si g(x) = la fel pentru variabilele declarate in functii ( ) al unui identificator (de ex variabila) = partea de program unde poate e cunoscut (si poate fi utilizat) Parametrii si variabilele declarate in functii au domeniul de vizibilitate corpul functiei nu sunt vizibile in exteriorul functiei Variabilele locale au automata: create la fiecare apel al functiei, distruse la incheierea acestuia (intre apeluri nu exista si deci nu isi pastreaza valoarea) Corpul { } unei functii С e o secventa de declaratii si instructiuni -in C99, declaratiile si instructiunile pot aparea in orice ordine -in standardele anterioare: intai declaratii, apoi instructiuni 19 octombrie 2004 - Cateva exemple - Scheme logice si programe structurate - instructiuni de ciclare - Tablouri Utilizarea si programarea calculatoarelor Curs 2 Marius Minea introducere in limbajul C 2 #include void main(void) int a, b, c; printf("introduceti trei numere intregi a b c: "); scanf ("° od ° od ° od", &a, &b, &c) ;  * sau 70d70d70d (la fel) *  printf("Cel mai mic numar este "); if (a  * functii matematice *  #include void main(void) float a, b, c, bl, d, delta; printf("Coeficientii ecuatiei:  * ax'42+bx+c=0 *  scanf ("7of7of° of" , &a, &b, &c) ; bl = -b (2 0*a); delta = bl*bl - c a; if (delta == 0) printf ("Solutie dubla: 7of n", bl); else if (delta > 0) { d = sqrt(delta);  * radacina patrata *  printf ("Solutii: 7o lf si 7o lf n", bl+d, bl-d) ; } else  * delta 0 int n, p, x; p = 1;  * valoarea initiala, x la puterea 0 *  while (n > 0) {  * n = de cate ori mai trebuie inmultit cu x *  p = p * x;  * facem inmultirea *  n = n - 1;  * a ramas cu o inmultire mai putin de facut *  Utilizarea si programarea calculatoarelor Curs 2 Marius Minea introducere in limbajul C 7 do instructiune while ( expresieJogica );  * poate fi { compusa } *  - se executa instructiunea - se evalueaza expresia - daca expresia e adevarata, se revine la executia instructiunii - daca expresia e falsa, ciclul se incheie Exemplu: char raspuns; do { printf("Apasati 3d’ pentru a continua: scanf (  7oC", feraspuns) ;  * citeste caracter, sare peste spatii *  } while (raspuns != ’d’);  * pana la raspunsul dorit *  Obs: in Pascal, din repeat until se iese pe conditie true (invers!) Utilizarea si programarea calculatoarelor Curs 2 Marius Minea introducere in limbajul C 8 exp imt; while (exp-test) { instructiune; exp cont; while (n > 0) { p = p * x; n = n - 1; for (exp J nit ; exptest ; expcont) instructiune e echivalenta* cu: * exceptie: instructiunea continue, vezi ulterior Calculul puterii: for (p = 1; n > 0; n = n - 1) p = p * x; - oricare din cele 3 expresii poate lipsi (dar cele doua ; raman) - daca exp test lipseste, e tot timpul adevarata (ciclu infinit) Cel mai simplu si frecvent caz: cand stim numarul de iteratii: int i;  * variabila cu care numaram iteratiile *  for (i = 0; i 0);  * ultima cifra e restul impartirii *   * avansam pentru urmatoarea cifra *   * impartire cu rest !! *   * i e numarul de cifre *  } while (i > 0);  * prima cifra e la pozitia i - 1 *   * ultima cifra e la pozitia 0 *  Utilizarea si programarea calculatoarelor Curs 2 Marius Minea introducere in limbajul C 12 Exista tablouri de oricate dimensiuni Pentru 2: matrici: int m ; interpretare: tablou de 10 elemente, fiecare un tablou de 7 intregi void main(void) { int i, j, m , sumcol ;  * matrice si suma pe coloane *  printf("Dati pe linii si coloane o matrice 5x3 de intregi n"); for (i = 0; i 3 => multimi de stari: reprezentate prin formule logice s sr  o formula peste V и Vr V’ = copie a lui V (variabilele starii urmatoare) ex (sema phore = red) A (sema phoref = green) - multimea tuturor tranzitiilor: relatia de tranzitie: formula 7^(V, V') Verificare formala Curs 2 Marius Minea Model Checking Notiuni de baza 4 Structura Kripke: automat cu stari finite, etichetat: M = (S,Sq,R,iP) - S: multime finita de stari - Sq C S: multimea starilor initiale -RCSxS: totala- Vs e S 3s' e S (s, e R (din orice stare exista cel putin o tranzitie) - L : S 2ap: functie de a starilor AP = multime de (observatii care apar in for- mule proprietati specificatii) Exemple: - o stare are atributul stabil sau nu - definim propozitia bad ::= red recvd > 1 Traiectorie pornind din starea sq: secventa infinita de stari 7Г = s0si52 • • •, cu si+i) pentru orice i > 0 Verificare formala Curs 2 Marius Minea Model Checking Notiuni de baza 5 Circuite secventiale: o variabila pentru fiecare element de stare (registru), si pentru intrarile primare se presupune: propagare combinationala instantanee Circuite asincrone: o variabila pentru fiecare semnal (in modele mai sofisticate: timp fizic explicit) Programe: variabile declarate + contorul de program Verificare formala Curs 2 Marius Minea Model Checking Notiuni de baza 6 Tipuri de compozitie: (obtinerea comportamentului sistemului din cel al componentelor) : conjunctie (tranzitii simultane) R(y, V') = Я1(Ѵ1, Vp л я2(ѵ2, v ) V = Vi и v2 : disjunctie (tranzitii individuale) R(V, V1) = R1(V1, Vi) A Eq(V   Vx) V Я2(Ѵ2, Л Eq(V   V2) Eq([7) =   veU(v = v') - alternanta arbitrara intre tranzitiile componentelor - o tranzitie modifica doar variabilele unei componente - tranzitii simultane se considera imposibile Modelarea programelor: de regula compozitie asincrona (nu exista sincronizare fizica intre instructiunile a doua programe concurente) Verificare formala Curs 2 Marius Minea Model Checking Notiuni de baza 7 — interactioneaza cu mediul {reactie la un anumit stimul) — adesea au executie infinita => o computatie = secventa infinita de stari => nu e suficienta reprezentarea comportamentului de intrare-iesire - Exemple simple: nu se atinge o anumita stare (de eroare) sistemul nu se blocheaza (deadlock) Mai general: proprietati descrise in - logica modala (notiune de adevar cu modalitati temporale) - utilizata din antichitate in rationamente despre timp - [Pnueli’77] - aplicare la programe concurente Verificare formala Curs 2 Marius Minea Model Checking Notiuni de baza 8 [Pnueli 1977] - ne intereseaza descrierea evenimentelor de-a lungul unei traiectorii => structura liniara in viitor apare un eveniment; o proprietate e invarianta de la un moment dat; un eveniment apare dupa alt eveniment Operatori temporali (modalitati de adevar pe o traiectorie): X(next): in urmatoarea stare F (futurey candva in viitor G (діоЬаІІуУ in orice stare viitoare U (untiiy propi obligatorie pana cand apare prop? uneori se mai defineste si urmatorul operator: R (releasey aparitia propi elimina obligativitatea prop? Verificare formala Curs 2 Marius Minea Model Checking Notiuni de baza 9 - dorim ca o proprietate sa fie adevarata pentru toate traiectoriile => folosim cuantificatorul universal A - formulele sunt de tipul Af, unde f este o formula de traiectorie - sintaxa formulelor de traiectorie: f ::= p (unde p e AP) Verificare formala Curs 2 Marius Minea Model Checking Notiuni de baza 10 Notam: M,s |= f: in modelul M, starea s satisface f 7гг = sufixul traiectoriei тг = sosis2 • • • incepand cu Sj M, s |= p M,s =Af 7И, тг 1= p 7И, тг 7И, тг 1= fl v  2 7И, тг  = fl A fa 7И, тг hxf 7И, тг hF  7И, тг hGf 7И, тг h f 1 u fa 7И, тг hfiR 2 p € L(s) V traiectorie тг din s, M, тг |= f M,s |= p, unde p e AP si s e prima stare din тг M, тг f M, 7Г |=  1 V M, ТГ |=  2 M, 7Г |=  1 Л M, 7Г |=  2 Л , тг1 |=   Bk > 0 M, 7rfe |= f У к > 0 M, 7rfe |= f Эк > 0 М, тг^ |= f 2 Л VJ 0 (VJ М, тгк |=  2 Verificare formala Curs 2 Marius Minea Model Checking Notiuni de baza 11 Uneori: modelul liniar insuficient (ex e posibil sa se atinga o stare) => alt model: arbori de computatie (computation treesy desfasurare infinita a grafului de stari-tranzitii pornind de la o stare initiala Verificare formala Curs 2 Marius Minea Model Checking Notiuni de baza 12 in plus: cuantificatorul existential E (exista o traiectorie) 3 Doua tipuri de formule: - formule de stare (state formula), evaluate intr-o stare   ::= p (unde p e AP) i "’ l i  1 v  2 i  1 л  2 | Eg i Ag (unde g = formula de traiectorie) - formule de traiectorie (path formula), evaluate pe o traiectorie g ::= f (unde   = formula de stare) i "'31 i 91 V g2 i 31 A Q2 i X 3i i F 3i i G 3i i 3i U 32 i 31 R 32 Semantica: la fel ca LTL, in plus: M, s |= Eg o 3 traiectorie тг din s cu M,-тг |= 3 Verificare formala Curs 2 Marius Minea Model Checking Notiuni de baza 13 f   g = V - 5) Ff = trueUf G  = -F-  A  = -iE-i  => Operatorii v, X, U si Esunt suficienti pentru a exprima orice formula in CTL* Verificare formala Curs 2 Marius Minea Model Checking Notiuni de baza 14 [Clarke, Emerson 1981] - suficienta in multe cazuri, dar mai simpla => algoritmi mai eficienti - structura ramificata (branching), ca si CTL* - cuantificare asupra traiectoriilor posibile dintr-o stare - operatorii X , F , G , U , R precedati imediat de A sau E - sintaxa formulelor de traiectorie: g "=Xf | Ff | Gf | AU 2 i AR 2 Verificare formala Curs 2 Marius Minea Model Checking Notiuni de baza 15 10 operatori de baza, exprimabili folosind EX , EGsi EU : AX-z EX - EF  = E [true U ] AF-z  G   AG  —EF^  A [f U g  = ->EG Л ->E hg U (-  Л -g)] E[ Rg] = ->A A[ RS]^EhfU^] Verificare formala Curs 2 Marius Minea Model Checking Notiuni de baza 16 EF finish Este posibil sa se ajunga intr-o stare in care finish = true AG (send AF ack) Orice send este urmat in cele din urma de un ack AF AG stable in orice executie, de la un moment dat, stable este invariant AG (req A [regU grant]) intotdeauna, un req ramine activ pana se obtine un grant AG AF ready Pe orice traiectorie, ready e satisfacut de un numar infinit de ori AG EF restart Din orice stare e posibil sa se ajunga in starea restart Verificare formala Curs 2 Marius Minea Model Checking Notiuni de baza 17 CTL si LTL sunt incomparabile: - A F G p e in LTL, nu are echivalent CTL - AG EF p e in CTL, nu are echivalent LTL - disjunctia lor e in CTL*, dar nu in CTL, nici in LTL Unele tehnici (compozitionalitate, abstractie) necesita restrictii: in mod tipic, e permis doar cuantificatorul universal A - ACTL (inclusa in CTL, incomparabila cu LTL) - ACTL* (inclusa in CTL*, mai expresiva decat LTL) Verificare formala Curs 2 Marius Minea Model Checking Notiuni de baza 18 in practica: presupuneri rezonabile de tipul: - un arbitru nu ignora la infinit una din cereri - un mesaj retransmis continuu isi atinge destinatia = proprietati exprimabile in CTL*, dar nu si in CTL => se defineste noua semantica pentru CTL cu fairness O restrictie de fairness e o formula in logica temporala O traiectorie e echitabila daca fiecare restrictie e adevarata infinit de multe ori de-a lungul traiectoriei in particular: restrictie exprimata ca multime de stari: o traiectorie echitabila trece infinit de multe ori prin acea multime Verificare formala Curs 2 Marius Minea Model Checking Notiuni de baza 19 Augmentam structura Kripke, M = (S,Sq,R,L,F')i cu F C 2s (F = multime de submultimi de stari, {Fi,      , Pn},c S) dcf inf(rr) = {s | s = si pt infinit de multi i} (multimea starilor care apar infinit de multe ori pe тг) тг este echitabila o VF e F inf(7r) n P 0 (тг trece infinit de multe ori prin orice multime din F) Notam |=y relatia de satisfacere cu fairness Clauze modificate in semantica CTL: M, s  =fp o exista o traiectorie echitabila plecand din s si p € F(s) M, s 1=2? Eg 3 traiectorie echitabila тг din s cu M, тг |=p g M,s  =р Ад -іф V traiectoriile echitabile тг din s, М,тг t=F g Verificare formala Curs 2 Marius Minea Model Checking Notiuni de baza 20 Fiind date o structura Kripke M = (S, Sq, R, L) si o formula   in logica temporala, sa se gaseasca starile din S care satisfac  : {s e s | m,s |=  } Specificatia e satisfacuta daca toate starile initiale satisfac f: Vsq & Sq M, Sq |=   - independent, Clarke & Emerson, resp Quielle & Sifakis (1981) - initial: iO4 — iO5 stari Actualmente, simbolic: cca iO100 stari - Descompunere dupa structura formulei f Pentru fiecare s e S, calculeaza Z(s) = multimea subformulelor lui   valabile in s - initial Z(s) = L(s) Trivial pentru conectorii logici ->,v,A - EX : se eticheteaza orice stare cu un succesor etichetat cu   - Ceilalti operatori de baza: EU si EG Verificare formala Curs 2 Marius Minea Model Checking Notiuni de baza 21 E [ i U f2]: traversare inapoi pornind de la f2, cat timp se satisface Д procedure CheckEU(fi, f2) T := {s |  2 e Z(s)} forall s e T do Z(s) := Z(s) U {E [ i U 2]}; while T 7^ 0 do chooses € T  T- = T {s}- forall si E(si,s) do if E [A U f2] l(S1) л A e Z(si) then Z(si) :=Z(si)U{E[ iU 2]}; T :=Tu{si}; Verificare formala Curs 2 Marius Minea Model Checking Notiuni de baza 22 EG : se considera doar statele care satisfac f Se traverseaza inapoi pornind de la componentele puternic conectate (SCC) procedure CheckEG(f) S' := {s | f & Z(s)}; SCC := {C | С e o SCC netriviala in S'}; T ' = Gc^scc{s i s e c}; forall s e T do Z(s) := Z(s) и {EG  }; while T  =0 do chooses € T  T ' = T   {s}  forall si si e S' л R(si, s) do if EG     Z(si) then Z(si) := Z(si) U {EG  }; T :=TU{si}; Verificare formala Curs 2 Marius Minea Model Checking Notiuni de baza 23 Consideram restrictia de fairness F = {РІ5 • • •, Pk}, unde Pi C S Fie fair o noua propozitie atomica, valabila in starea s daca exista o traiectorie echitabila care porneste din s Deci faire L(s) о M, s  =f EG true Pentru ceilalti operatori, reducem la model checking obisnuit: M, s  =F p o M, s |= p Л fair M,s  =F EX f o M,s |= EX (f Л fair) M, s  =F E & M, s |= E Pentru M, s |=f EG   modificam algoritmul anterior, considerand doar SCC-urile cu   i C n Pi 0 (care contin cel putin o stare din fiecare componenta a restrictiei de fairness) Verificare formala Curs 2 Marius Minea Model Checking Notiuni de baza 24 - model checking CTL: 0(1 1 • (|5'| + l-R|)) (liniar in dimensiunea modelului si a formulei) - CTL cu fairness F: O(| |   (|S| + |Я|)   |F|) - LTL: PSPACE-complet  M    2°(l l> (algoritm de alt tip, bazat pe o constructie de tablou) - CTL*: la fel ca LTL  M    2°d D CTL: adesea preferat, datorita algoritmului polinomial dar si in LTL, exponentiala e doar in dimensiunea formulei (mica) Verificare formala Curs 2 Marius Minea 4 mai 2004 O sistematizare a analizelor de flux de date Analiza interprocedurale Aplicatie: property simulation Analiza programelor Curs 2 Marius Minea Analiza fluxului de date 2 : analizam diverse proprietati, de ex - valoarea unei variabile intr-un punct de program - sau intervalul de valori pentru o variabila - sau multimi de variabile (live), expresii (available, very busy), definitii posibile pentru o valoare (reaching definitions), etc : o multime D de valori pentru o proprietate (dataflow facts) Restrictie: D e o multime Analiza programelor Curs 2 Marius Minea Analiza fluxului de date 3 - am asociat cu punctele de program multimi de valori pentru proprietatea analizata - am recalculat iterativ multimile respective, prin operatii de reuniune sau intersectie; obtinand tot mai multe (sau mai putine) valori Care sunt premisele esentiale pentru a efectua calculele in acest fel ? (L, □) e o multime echipata cu o ЕС L x L, adica o relatie: - reflexiva, x □ x pentru orice x e L - tranzitiva, xtyhyLz^xtz, pentru orice x,y,z e L - antisimetrica: x ^y  y ^x^x = y, pentru orice ж, у e L Exemplu: multimea partilor (P(D),C) sau (P(Z?),D) Analiza programelor Curs 2 Marius Minea Analiza fluxului de date 4 Latice (completa) = o multime partial ordonata in care orice submultime finita are un cel mai mic majorant (least upper bound) si cel mai mare minorant (greatest upper bound) iq e majorant al lui Y C L daca VZ e Y avem l □ iq iq e minorant al lui Y C L daca VZ e Y avem iq □ Z Notam: [JY: cel mai mic majorant al multimii Пк: cel mai mare minorant al multimii Y C L si± = U0 = riL Т=П0 = иГ Definim atunci operatiile meet : хПу = П{ж,і } Join : x U у = | |{ж, у} (in cazul multimii partilor: intersectie, reuniune) Analiza programelor Curs 2 Marius Minea Analiza fluxului de date 5 Operatiile n (meet) si и (Joiii) au proprietatile: — sunt comutative - sunt asociative - ж П ± = ± si x и T = T, pentru orice x Latice distributiva: in care operatorii n si и sunt reciproc distributivi: x П (y U г) = (ж П у) U (ж П г) х U (у П г) = (ж U у) П (ж U г) Analiza programelor Curs 2 Marius Minea Analiza fluxului de date 6 instructiunile determina modificari ale starii programului Valoarea unei variabile dupa o instructiune e o functie a valorii de la inceputul instructiunii : Fiecare instructiune s are asociata o functie de transfer F(s) : L L care determina modul in care valoarea proprietatii la inceputul instructiunii e modificata de instructiune: Propout(s) = F(s)(ProPin(s^ (Pentru analize inainte), sau invers (pentru analize inapoi) Restrictie: punem conditia ca functiile de transfer sa fie monotone:   E у => f O) C f (y) (daca stim mai multe despre argument, atunci si despre rezultat) Caz particular: bitvector frameworks: laticea e o multime de parti P(B), functii de transfer monotone si de forma: F(s)(t>) = (v   kill(s)) U gen(s) (v = dataflow fact, gen killts) = informatia generata eliminata in s) Analiza programelor Curs 2 Marius Minea Analiza fluxului de date 7 Exemplu: pentru analize inainte: Pr°Poi t(s) = i?(s)(-ProP n(s)) Propin(s) = ns,eprec (s) Propout(s') unde prin П am reprezentat efectul combinarii informatiilor (meet) pe mai multe cai (ar putea fi n sau u) initial, e cunoscuta valoarea Propout(entry) Pentru analize inapoi, se schimba rolul intre in si out, si e cunoscuta valoarea lui Propin(exity) Analiza programelor Curs 2 Marius Minea Analiza fluxului de date 8 Pentru calculul solutiei la sistemul de ecuatii de mai sus: algoritmi iterativ care propaga modificarile in sensul analizei foreach s e N do Propus) = T  * no info *  Propjn(entry') = init  * in functie de analiza *  W = {entry} while W 7^ 0 choose s & W w = VP {s} Prop n(s) = ns,eprecy(s) Propout(s') Propout(s) = ^(s)(Frop;-n(s)) if change then forall s' e succ(s) do W = W и {s'} Analiza programelor Curs 2 Marius Minea Analiza fluxului de date 9 Terminarea analizei e garantata daca functia de transfer e monotona: x □ у =>  ( t) □ fty), ceea ce implica faptul ca proprietatile calculate se modifica in mod monoton Def: pentru o functie f: o valoare x pt care  ( t) = x Teorema lui Tarski garanteaza ca o functie monotona pe o latice completa are un punct fix minimal si un punct fix maximal Algoritmul worklist calculeaza punctul fix minimal dat fiind sistemul de functii de transfer Analiza programelor Curs 2 Marius Minea Analiza fluxului de date 10 Dorim sa calculam efectul combinat al instructiunilor programului: pentru p = S1S2 sn sir de instructiuni definim F(p) = F(sn) o o F(s2) o F(si) si dorim sa calculam: ^pGPath(Prog) Fp(entry) Dar algoritmul iterativ combina efectele la fiecare punct de intalnire inainte de a calcula mai departe Functiile f fiind monotone, avem: f^xUy) □  (ж) U (y) deci analiza pierde din precizie Pentru functiile de transfer distributive avem chiar:  (ж) и  (у) =  (ж U у) Se demonstreaza ca in acest caz algoritmul iterativ (care genereaza o solutie de punct fix) e echivalent cu calculul solutiei prin combinarea valorilor pe toate caile posibile {meet over all paths) => combinarea diverselor cai de executie nu pierde informatie Cele 4 exemple date (live variables, etc ) sunt distributive Analiza programelor Curs 2 Marius Minea Analiza fluxului de date 11 — inainte sau inapoi — must sau may - dependente sau independente de fluxul de control (flow (in)sensitive): Trebuie luata in considerare ordinea instructiunilor in program - nu: ce variabile sunt folosite modificate, functii apelate, etc - da: proprietati legate de valorile calculate efective de program - dependente sau independente de context in cazul programelor ce contin proceduri: e specializata analiza fiecarei proceduri in functie de locul de apel, sau se poate face un sumar (o analiza comuna) ? Analiza programelor Curs 2 Marius Minea Analiza fluxului de date 12 Modelarea programelor cu proceduri: in graful de flux de control, un - muchie de la locul de apel la inceputul procedurii - muchie de la sfarsitul procedurii la instructiunea de dupa apel in felul acesta, se obtin toate caile, dar si cai nefezabile => se restrange analiza asupra cailor realizabile, in care apelurile si reintoarcerile din functii sunt imperecheate corect Analiza programelor Curs 2 Marius Minea Analiza fluxului de date 13 [Reps, Horwitz, Sagiv ’95] - pentru un subset de probleme de analiza de flux de date (interprocedural, finite, distributive subset problem) Analiza programelor Curs 2 Marius Minea Analiza fluxului de date 14 [Das, Lerner, Seigle '02 - Microsoft + U Washington] - o analiza statica {property simulatiorT) scalabila la n-100 kloc - exemplu: absenta de erori in > 600 apeluri de sistem pentru 15 pointeri de fisiere in codul gcc (140 kloc) - prin analiza hibrida intre o analiza standard de flux de data (imprecisa) si analiza dependenta de cale (path-sensitive, prea costisitoare) - pastrand corelarea dintre starea proprietatii analizate (ex uninit, open, ciosed pentru fisier) si variabilele relevante din program) if (dump) f = fopen(dumpFil, "w"); if (p) x = 0; else x = 1; if (dump) fclose(f); Analiza programelor Curs 2 Marius Minea Marius Minea marius@cs upt ro http:  www cs upt ro  marius curs lsd  3 octombrie 2016 Am revazut: functii (injective, surjective, bijective, inversabile) Am definit functii intr-un limbaj de programare functional Functia e data prin formula, dar si prin domeniu si codomeniu: in limbajele de programare Tipurile ne spun pe ce fel de valori poate fi folosita o functie Am revazut: functii (injective, surjective, bijective, inversabile) Am definit functii intr-un limbaj de programare functional Functia e data prin formula, dar si prin domeniu si codomeniu: in limbajele de programare Tipurile ne spun pe ce fel de valori poate fi folosita o functie g f x = g (f x) ;; val comp: (’a -> ’b) -> (’c -> ’a) -> ’c -> ’b = 10—>5—>16—>8—>4—>2—>1 11—>34—>17—>52—>26—>13—>40—>20—>10—>5—>16—>8—>4—>2—>1 Vrem sa definim functia p : iT —> N care exprima numarul de pasi pana la oprire Nu avem o formula cu care sa definim p(n) direct Dar daca sirul n, f(n), ajunge la 1, numarul de pasi pornind de la n e cu unul mai mare decat de la f(n): p(n) = 0 daca n = 1 1 + p(f(n)) altfel (daca n > 1) Functia p a fost definita : e folosita in propria definitie n = n mod 2=0 n 2 3*n+l in ML, c el e2 e o (conditionala) daca c e adevarata, are valoarea lui el, altfel valoarea lui e2 n = n = 1 0 1 + p (f n) Cuvintele cheie introduc o functia p e folosita (apelata) in propria definitie Putem scrie aceeasi functie si asa: i 1 -> O i n -> 1 + p (f n) Citim aceasta definitie astfel: Definim p ca functie, pe urmatoarele cazuri: - daca argumentul e 1, valoarea functiei e 0 - daca argumentul are orice alta valoare (o notam n), valoarea functiei e 1 + p (f n) Cuvintele cheie si se folosesc diferit! cu xl x2 -> expresie putem scrie pentru valoarea functiei (si putem avea oricati parametri xl, x2 ) cu definim o functie prin cu parametru (NU am scris let p n = ci denumim parametrul in stanga lui -> pe ramura unde avem nevoie de el Fiecare ramura indica rezultatul (in dreapta) returnat daca argumentul se potriveste cu tiparul din stanga Argumentul care e potrivit cu tiparul poate fi: o constanta (aici, 1) o valoare structurata (pereche, lista cu cap coada, etc ) un identificator (nume) care indica tot argumentul (oricare ar fi) Potrivirile se incearca in ordinea indicata, pana la prima reusita Tipizarea puternica permite avertismente daca uitam un caz Ex : o functie care ia triplete de intregi si da suma componentelor pana la primul zero identificatorul special se potriveste cu orice: i (0, ) -> 0 i (x, 0, ) -> x i (x, у, z) -> X + у + z daca prima componenta e 0, rezultatul e 0, indiferent de celelalte altfel, daca a doua componenta e 0, adunam doar prima (nu si a treia) altfel, primele doua sunt nenule, si le sumam pe toate trei (x, y, z) = x = 0 0 у = 0 x x + y + z in calculul recursiv , pana la cazul de baza Fiecare apel face "in cascada" Fiecare apel executa , dar cu (valori proprii pentru parametri) Ajunsi la cazul de baza, toate apelurile facute sunt inca (fiecare mai are de facut adunarea cu rezultatul apelului efectuat) Revenirea se face apelarii (apelul cu indice 0 revine primul, apoi cel cu indice 1, etc ) in interpretor, vizualizati apelurile si revenirea cu directiva #trace numefunctie reveniti la normal cu #untrace numefunctie progresie aritmetica: Xq = b (adica: xn = b pentru n = 0) xn = xn i + r pentru n > 0 Exemplu: 1,4, 7,10,13, ( ? = 1, r = 3) progresie geometrica: {xq = b (adica: xn = b pentru n = 0) xn = xn-i   r pentru n > 0 Exemplu: 3, 6,12, 24,48, ( ? = 3, r = 2) Definitiile de mai sus nu calculeaza xn direct (desi se poate) ci , folosind xn i sirul xn e => recursivitate   recurenta intai o progresie aritmetica cu baza si ratia fixate: Xq = 3, Xn = Xn i + 2 (pentru n > 0) Notiunea recursiva (sirul) devine o Valorile de care depinde (indicele) devin functiei i 0 -> 3 i n -> 2 + aritpr 3 2 (n-1) Cum parametrizam functia cu baza si ratie ? Pana acum: definitii notiune = expresie adica = expresie sau paraml paramN = expresie Uneori, sunt utile definitii auxiliare De exemplu, aria triunghiului de laturi a, b, с e у  p(p — a)(p — — c) unde p = a+?+c in ML, putem scrie a b c = = (a + b + c)   2 sqrt (p * (p a) * (p b) * (p c)) Definitia e tot de forma functie argl argN = expresie unde expresie are o noua forma: notiune = expr def expr val Aceasta e o expresie cu valoarea data de expr val, in care numele definit in stanga lui = (notiune) ia sensul dat in dreapta (expr def) Putem scrie o functie mai generala cu baza si ratia ca parametri: base step = i 0 -> base i n -> step + aritpr base step (n-1) in apelul recursiv, base si step sunt aceleasi, si vedem de doua ori expresia aritpr base step , o functie de 1 argument (indicele) base step = Rescriem cu o definitie locala   i г   i 1 i 0 -> base numind functia de 1 argument: и ° i n -> step + apl (n-1) apl E la fel ca base step = apl , cu definit doar local Functia (de intreg) vede parametrii base si step ai lui Putem defini apoi functii care corespund unor progresii individuale: = aritpr 3 2 aritpr 3 2 4 - : int = 11 Recursivitatea e fundamentala in informatica: reduce o problema la un caz mai simplu al probleme {un singur element Q sir , -4 un element urmat de un ООО O ex cuvant (sir de litere); numar (sir de cifre zecimale) : un e {un pas —> drum un urmat de un pas '——>' —> ex parcurgerea unei cai intr-un graf Definim un tip recursiv care sa reprezinte structura unei expresii (impreuna cu eventualul operator pentru calcul) expr = i int i A expr * expr | S expr * expr i M expr * expr | D expr * expr Am definit un tip cu mai multe variante Fiecare din ele trebuie scrisa cu un (eticheta), ales de noi: i,A, etc (orice identificator cu litera mare) Notatia expr * expr reprezinta produsul cartezian, deci o pereche de doua valori de tipul expr Tipul expr e (o valoare de tip expresie poate contine la randul ei componente de tip expresie) Expresia (2 + 3) * 5 se reprezinta ca M (A(i 2, 13), 15) Lucrul cu o valoare de tip recursiv se face prin (engl pattern matching), pentru fiecare varianta din tip i i -> i A (el, e2) -> eval el + eval e2 S (el, e2) -> eval el - eval e2 M (el, e2) -> eval el * eval e2 D (el, e2) -> eval el   eval e2 Evaluam o expresie de acest tip: eval (M (A(i 2, 13), i 5)) returneaza 25 Cand un tip de date e definit recursiv functiile care il prelucreaza vor fi natural recursive deobicei cu cate un caz pentru fiecare varianta a tipului respectiv 1 ( necesita apel recursiv) = cel mai simplu caz pentru definitia (notiunea) data, definit direct termenul initial dintr-un sir recurent: xq un element, in definitia: sir = element sau sir + element E o daca lipseste cazul de baza (apel recursiv infinit!) 2 propriu-zisa - defineste notiunea, folosind un caz mai simplu al aceleiasi notiuni 3 Demonstratie de dupa numar finit de pasi (ex o marime nenegativa care descreste cand aplicam definitia) - la siruri recurente: indicele (> 0 dar mai mic in corpul definitiei) - la obiecte: dimensiunea (definim obiectul prin alt obiect mai mic) ? Xn+1 = 2 • xn 7 xn = xn+i 3 ? an = a • a • • a (de n ori) ? o fraza e o insiruire de cuvinte ? un sir e un sir mai mic urmat de un alt sir mai mic ? un sir e un caracter urmat de un sir 0 definitie recursiva trebuie sa fie bine formata (v conditiile 1-3) ceva nu se poate defini doar in functie de sine insusi se pot utiliza doar notiuni deja definite nu se poate genera un calcul infinit (trebuie sa se opreasca) Figuri geometrice in care o parte a figurii e similara intregului acesta e aspectul recursiv Apar in natura, sau pot simula artificial figuri din natura Analiza lor are aplicatii in diverse domenii: geografie geologie, medicina, prelucrarea semnalelor, electrotehnica (microantene), etc b) sum all(a b) = a + sum all(a + 1, b) (daca a > b) int sum all(int a, int b) return a > b ? 0 : a + sum all(a+l, b); Din matematica: ao = 1, an+i = |(an + ^-) sirul aproximatiilor e problema e natural recursiva ce se da (parametri): x si aproximatia curenta ce se cere = o aproximatie suficient de buna (precizie e) Formulam problema: calculeaza л х stiind aproximatia curenta an Cazul de baza: la precizie buna |an+i — an|    pentru declaratia double fabs(double x) ; (val abs real) double rad(double x, double an) {    rad lui x, data aprox an return fabs(an - x an) 0 (in = termenul general, pentru care avem o formula) Exemplu pentru seria armonica (in = 1 n) sn = 1 1 + 1 2 + + 1 n recursiv: sp = 0, sn = sn i + 1 n pentru n > 0 in cuvinte: stim sa raspundem direct cat e so : 0 Nu putem calcula direct sn (pentru n > 0), dar daca aflam cat e sn i mai trebuie sa adunam 1 n Functia care calculeaza pe s(n) raspunde 0 daca n = 0 iar altfel, calculeaza s(n — 1), aduna 1 n si returneaza rezultatul #include double suma rec(unsigned n) { return n == 0 ? 0 : suma rec(n-1) + 1 0 n; } int main(void) { printf("suma pana la 1 100: %f n", suma rec(100)); return 0; } Termenii se aduna la revenirea din apel, de la 1 1 la 1 100 1 0   n : operatie intre real si intreg : intregul convertit la real : 1 n da valoarea 0 cand n > 1 (impartire intreaga) 1Т 1Т in sn = sn-i + 1 n, trebuie adunat 1 n, dar nu stim inca sn i folosim un rezultat partial rez la care adunam 1 n apelam recursiv cu valoarea rez + 1 0 n double suma inv(unsigned n, double rez) { return n == 0 ? rez : suma inv(n - 1, rez + 1 0 n); Cand n = 0, totul e adunat deja in rez, care e returnat ca rezultat in apelul initial, rezultatul acumulat e zero: suma inv(100, 0 0) rez e o valoare auxiliara, nu face parte din enuntul problemei Definim o functie cu un singur parametru, care apeleaza suma inv double serie armonica(unsigned n) { return suma inv(n, 0 0); } Calculam sn = sn-i + in (n > 0), cu so = 0 pana cand valoarea absoluta a termenului in = xn n  e neglijabila Gandim recursiv: calculul , data fiind sn— 1- - daca termenul in e suficient de mic, returnam suma curenta - altfel: apel recursiv, calculam de la sn i + in Exemplu: seria 1 + 1 22 + 1 32 + = 7г2 б in = 1 n2 (n > 0): double sum 2(unsigned n, double s n l) { return l  n n b ? a : b; } unsigned maxcifra(unsigned n) { return n 0x40: © A В C D E F G H i J К L M N 0x50: P Q R S T U V W X Y Z [   ] ** 0x60: c a b c d e f g h i j к 1 m n 0x70: p q r s t u V w X У z 1 Prefixul denota (in baza 16) Caracterele poate fi memorat pe (8 ) Cf standard: char poate fi , de la -128 la 127, sau , de la 0 la 255 Ambele sunt incluse in int in program, se scriu intre ’ ’ Au valori intregi (cod ASCii) in calcul: convertite automat la int Cifrele, literele mici si literele mari sunt avem: ’7’ == >o> + 7 ’5’ - ’0’ == 5 ’E’ - ’A’ == 4 ’f’ == ’a’ + 5 Reprezentari pentru caractere speciale:  0’ nuli ’ n’ linie noua  a’ alarm ’ r’ carriage return  b’ backspace ’ f ’ form feed  t ’ tab a postrof  v ’ vertical tab ’W backslash functiei, in stdio,h : int getchar(void); functiei: getcharO fara parametri, dar cu O Returneaza codul ASCii ca unsigned char convertit la int, sau returneaza valoarea EOF daca nu s-a citit un caracter (la sfarsit de fisier, end-of-file) E nevoie ca getcharO sa returneze int si nu char pentru a putea exprima si constanta EOF (-1, diferita de orice unsigned char) La tastatura, caracterele sunt introduse cu ecou, intr-un tampon, programul le preia (ex getcharO doar dupa tastarea Enter ATENtiE! Programul nu are control asupra datelor de intrare! => trebuie si tratate erorile functiei, in stdio,h : int putchar(int c); functiei (exemplu): putchar(’7’) un unsigned char (dat ca int); returneaza valoarea scrisa #include int main(void) { putchar(’A’); putchar(’:;    scrie A apoi : putchar(getcharO);    scrie caracterul citit return 0; } Folosim tot definitia recursiva a numarului, evidentiind ultima cifra Fie numarul C1C2 cm, si secventele partiale q, C1C2, C1C2C3, Avem: ro = 0, Гк = 10   Гк-і + Ck, {к > 0) Definim recursiv o functie care calculeaza numarul pornind de la гіл   si cifra curenta Ck’- - cand caracterul citit nu mai e cifra, numarul e gata format in r - altfel, continua recursiv de la 10   r + c, citind urmatorul caracter Atentie, getcharO returneaza codul ASCii, nu valoarea cifrei ajustam cu -’0’, de ex 6 == ’6’ - ’0’ ctype h contine declaratiile functiilor de clasificare a caracterelor: isalpha, isalnum, isdigit, isspace, etc Ele iau ca parametru un caracter si returneaza adevarat sau fals (caracterul e de tipul respectiv, sau nu) #include #include unsigned readnat rc(unsigned r, int c) { return isdigit(c) ? readnat rc(10*r + (c-’O’), getcharO) : r; r: numarul deja acumulat, c: caracterul curent citit de la intrare Ca solutie finala, scriem o functie fara parametri auxiliari: int readnat(void) { return readnat rc(0, getcharO); } Scriem o functie care citeste un intreg, ce poate avea si semn:    functie auxiliara: c: primul caracter int readint c(int c) return c == ? - readnatO   c == ’ + ’ ? readnatO   readnat rc(O, c);    functia ceruta fara parametru int readint(void) { return readint c(getcharO); } int main(void) printf("numarul citit este: %d n", readint()); return 0; Un calcul pur nu are alte efecte: urmatorul program nu scrie nimic! int sqr(int x) { return x * x; } int main(void) { return sqr(2); } Apelul repetat al unei functii (in matematica, sau cele scrise pana acum: sqr, fact, etc ) cu aceiasi parametri da acelasi rezultat Tiparirea (printf) produce un efect vizibil (si ireversibil) getcharO returneaza caracter din intrare la fiecare apel; caracterul e O modificare in starea mediului de executie a programului se numeste (ex citire, scriere, atribuire - v ulterior) Uneori e necesar sa memoram o valoare (caracter citit de la intrare, pentru a nu-l pierde; rezultat de functie, pentru a nu-l recalcula) Vom discuta cum se face aceasta prin unei intr-o functie: ce se da (parametrii); ce se cere (rezultatul) Pentru rezultate valori intermediare Ex: citirea de numar: caract curent c nu e in enuntul problemei => e ceva ajutator, poate fi citit in functie Declaram o variabila: unsigned readnat r(unsigned r) { int c = getcharO;    declaram si initializam c return isdigit(c) ? readnat r(10*r + c - ’0’) : r; } 0 e un obiect cu un nume si un tip E utila la memorarea unor valori (altele decat parametrii de functie) necesare in calcule : una sau mai multe variabile de acelasi tip: double x; int a = 1, b, c; (a e initializat cu 1, restul nu) Declaram variabile cand e nevoie sa (de exemplu returnate de functii) pentru Un program C: o colectie de functii, fiecare rezolva o subproblema; programul principal main le combina (apeleaza functiile) Numele parametrilor unor functii diferite nu se influenteaza; ca si in matematica putem avea f(x) = si g(x) = la fel pentru variabilele declarate in functii ( ) al unui identificator (de ex variabila) = partea de program unde poate e cunoscut (si poate fi utilizat) Parametrii si variabilele declarate in functii au domeniul de vizibilitate corpul functiei nu sunt vizibile in exteriorul functiei Variabilele locale au automata: create la fiecare apel al functiei, distruse la incheierea acestuia (intre apeluri nu exista si deci nu isi pastreaza valoarea) Corpul { } unei functii С e o secventa de declaratii si instructiuni -in C99, declaratiile si instructiunile pot aparea in orice ordine -in standardele anterioare: intai declaratii, apoi instructiuni Marius Minea marius@cs upt ro http:  www cs upt ro  marius curs f i 7 octombrie 2011 Pe liste se pot defini functii generice de prelucrare => putem itera prelucrari fara a scrie repetat acelasi cadru Modulul List din ML are astfel de functii: iter : (’a -> unit) -> ’a list -> unit iter f [al; a2; an] apeleaza f al; f a2; f an; () map : (’a -> ’b) -> ’a list -> ’b list map [al; a2; ; an] e lista [f al; f a2; f an] fold left : (’a -> ’b -> ’a) -> ’a -> ’b list -> ’a fold left f a [bl; b2; bn] = f ( f (fa bl) b2 ) bn fold right : (’a -> ’b -> ’b) -> ’a list -> ’b -> ’b fold right f [al; a2; ; an] b = f al (f a2 ( (f an b) )) filter f [al; a2; ; an] : elementele pentru care f e adevarata let rec iter f = function i [] -> O i h :: t -> (f h; iter f t) let rec map f = function i [] -> [] i h :: t -> f h :: map f t let rec fold left f a = function i □ -> a i h :: t -> fold left f (f a h) t let rec fold right f ist b = match ist with [] -> b i h :: t -> f h (fold right f t b) let filter f = function i [] -> [] i h :: t -> if f h then h :: filter f t else filter f t List iter print int tipareste 123 List map ((+) 2) are ca rezultat Putem implementa inversarea rev cu fold left : let rev = List fold  left (fun t h -> h :: t) [] Putem implementa minimul unei liste: let list min = function i [] -> invalid arg "empty list" (* exceptie *) i h :: t -> List fold left min h t Programele pot fi oricat de complexe, dar au structura riguros definita => se preteaza la definitii recursive -insiruiri liniare: un program are oricate functii, o functie are oricate argumente si instructiuni, etc - structuri mai complexe, ex expresie formata din operator si 2 expresii Structura (sintaxa, ) limbajului se reprezinta uzual intr-o notatie standard numita BNF (Backus-Naur Form) Ex antet-functie ::= tip identificator ( parametri") parametri ::= void | lista-parametri lista-parametri ::= tip identificator | tip identificator , lista-parametri unde ::= denota definitie iar | alternativa (alegere) Termenii definiti prin reguli se numesc (engl nonterminal) Cazuri particulare: recursivitate la stanga si la dreapta, dupa locul in care apare notiunea recursiva in corpul definitiei expr ::= intreg | ( expr ) | expr + expr | expr — expr | expr * expr | expr   expr Definitia e pentru ca o expresie poate avea mai multe (interpretari), daca nu stabilim reguli de precedenta Pentru 9 + 5 * 4 am putea interpreta: 9 + 5 = expr, deci (9 + 5) * 4, sau 5*4 = expr, deci 9 + (5 * 4) Rescriem gramatica: expr ::= term | expr + term | expr — term term ::= factor | term * factor | term   factor factor :: = intreg | ( expr ) expr si term au definitii Toate trei sunt : expr —> term —> factor —> expr implementam cate o functie pentru fiecare neterminal Pentru expr ::= expri + term dam ca parametru expri din dreapta (valoare deja calculata) si apelam recursiv cu expri ± term daca apare ±; altfel returnam valoarea primita (vezi cod in C si ML) {а а = b cmmdc(a — b, b) a > b cmmdc(a, b — a) a b ? cmmdc(a-b, b) : cmmdc(a, b-a); int main(void) { printf("cmmdc(20, 8) e 70u n",    ° ou = unsigned cmmdc(20, 8)); return 0; Calculul e corect doar cu a si b nenule Pentru a trata si cazul zero: return a == 0 ? b : b == 0 ? a : a > b ? cmmdc(a-b, b) : cmmdc(a, b-a); Forma: So = to, sn = sn-i + in, pentru n > 0 (in = termenul general, pentru care avem o formula) Exemplu pentru seria armonica (in = 1 n) sn = 1 1 + 1 2 + + 1 n recursiv: sp = 0, sn = sn i + 1 n pentru n > 0 in cuvinte: stim sa raspundem direct cat e so : 0 Nu putem calcula direct sn (pentru n > 0), dar daca aflam cat e sn i mai trebuie sa adunam 1 n Functia care calculeaza pe s(n) raspunde 0 daca n = 0 iar altfel, calculeaza s(n — 1), aduna 1 n si returneaza rezultatul #include double suma rec(unsigned n) { return n == 0 ? 0 : suma rec(n-1) + 1 0 n; } int main(void) { printf("suma pana la 1 100: %f n", suma rec(100)); return 0; } Termenii se aduna incepand de la 1 1 la 1 100, la revenirea din apel 1 0   n : operatie intre real si intreg : intregul convertit la real : 1 n da valoarea 0 cand n > 1 (impartire intreaga) 1Т 1Т in sn = sn-i + 1 n, trebuie adunat 1 n, dar nu stim inca sn i folosim un rezultat partial rez la care adunam 1 n apelam recursiv cu valoarea rez + 1 0 n double suma inv(unsigned n, double rez) { return n == 0 ? rez : suma inv(n - 1, rez + 1 0 n); Cand n = 0, totul e adunat deja in rez, care e returnat ca rezultat in apelul initial, rezultatul acumulat e zero: suma inv(100, 0 0) rez e un detaliu de implementare, nu face parte din enuntul problemei definim o functie cu un singur parametru, care apeleaza suma inv double serie armonica(unsigned n) { return suma inv(n, 0 0); } Din matematica: ao = 1, an+i = ^(an + Formulam recursiv: Calculul (ex cu e = iO-3) de la o ce se da (parametri): x si aproximatia curenta ce se cere = val functiei (o aproximatie suficient de buna) Daca precizia e buna |an+i — an| |an — x an     pentru declaratia double fabs(double x) ; (val abs nr real) double rad(double x, double a n) {    rad lui x, se da aprox a n return fabs(a n - x a n) 0), cu so = 0 pana cand valoarea absoluta a termenului in = xn n  e neglijabila Formulam recursiv: calculul , data fiind sn i: - daca termenul curent in e suficient de mic, returnam suma curenta - altfel, returnam suma calculata , de la sn i + in Exemplu: seria 1 + 1 22 + 1 32 + = 7г2 б in = 1 n2 (n > 0): double sum 2(unsigned n, double s n l) { return l  n n 0) Pentru a nu recalcula inutil in in pe xn 1 si (n — 1)! exprimam recursiv in = in-i -x n, pentru n > 0, to = 1 => la pasul curent, avem sn 2 si 1, calculam in si sn i =sn 2 + in-i #include #include double e xr(double x, unsigned n, double s n 2, double t n l) { return fabs(t n l) P(n + 1) daca P(n) adevarat atunci P(n + 1) adevarat - la recurenta: definim ceva mai mare prin ceva mai mic se opreste cand ajungem la cazul de baza (suficient de simplu) Marius Minea 4 martie 2008 Programarea calculatoarelor Curs 2 Marius Minea Programarea calculatoarelor Recursivitate 2 #include int sqr(int x) { printf ("Patratul lui ° od e ° od n" , x, x*x); return x * x; int main(void) { in ce ordine se scrie pe ecran ? printf("2 la a 6-a e return 0; ° od n" , sqr(2 * sqr(2))); Patratul lui 2 e 4 Patratul lui 8 e 64 2 la a 6-a e 64 in C, transmiterea parametrilor la functii se face - se (calculeaza valoarea) toate argumentele functiei - valorile se atribuie la (numele din def fct ) - apoi se incepe executia functiei cu aceste valori Programarea calculatoarelor Curs 2 Marius Minea Programarea calculatoarelor Recursivitate 3 in exemplu: programul incepe cu executia lui main, deci tiparirea printf - printf are nevoie de valoarea argumentelor sale Prima se stie (o ), a doua trebuie calculata: sqr(2 * sqr(2)) - pentru a efectua apelul exterior al lui sqr trebuie stiut argumentul, adica 2 * sqr(2) Deci se efectueaza intai apelul interior, sqr(2) => ordinea: sqr(2), apoi sqr(8), apoi printf din main Cum s-ar mai putea altfel, dar in C: : functia incepe executia si isi calculeaza argumentele la nevoie - printf ar tipari intai 2 la puterea 6 e, apoi ii trebuie valoarea - ar apela sqr exterior care scrie Patratul lui, apoi ii trebuie x - ar apela sqr(2) care scrie Patratul lui 2 e 4, returneaza 4, etc : se substituie argument pentru parametrii functiei - din printf s-ar apela sqr exterior cu 2 * sqr(2) - pt a calcula (2*sqr(2))*(2*sqr(2)) s-ar apela sqr(2) de doua ori => in C, o functie calculeaza numai cu , niciodata cu Programarea calculatoarelor Curs 2 Marius Minea Programarea calculatoarelor Recursivitate 4 Recursivitatea e un concept fundamental in matematica si informatica Un obiect (notiune) e recursiv(a) daca e folosit in propria sa definitie Exemplu din matematica: siruri recurente: - progresie aritmetica: xq = a, - progresie geometrica: xq = b, s a m d : combinari sirul lui xn = xn i + p, pentru n > 0 xn = a • xn i, pentru n > 0 Fibonacci, Alte exemple: - obiecte definite recursiv: un sir e un singur element, sau un element urmat de un sir ex : cuvant (sir de litere); numar (sir de cifre zecimale) — actiuni definite recursiv: un drum e un pas, sau un drum urmat de inca un pas (de exemplu o caleintr-un graf) Programarea calculatoarelor Curs 2 Marius Minea Programarea calculatoarelor Recursivitate 5 #include float pwr(float x, unsigned n) ( 1 n = 0 1 x • xn l n > 0 return n==0 ? 1 int main(void) printf("-2 la 3 return 0; x * pwr(x, n-1) ; = ° of n", pwr(-2 0, 3)); - tipul unsigned reprezinta intregi fara semn (numere naturale) - antetul functiei reprezinta o declaratie a ei, deci poate fi folosita in orice punct ulterior (inclusivin propriul corp — cazul apelului recursiv) - chiar daca scriem putere(-2, 3), -2 va fi convertit la real, intrucat se cunoaste tipul necesar pentru fiecare parametru Programarea calculatoarelor Curs 2 Marius Minea Programarea calculatoarelor Recursivitate 6 Functia pwr face doua calcule: - un test (n == o ? a ajuns la cazul de baza ?) daca da, return 1 - daca nu, o inmultire; pt operandul drept trebuie un nou apel, recursiv pwr(5, 3) apelt tl25 5 * pwr(5, 2) apelt i25 5 * pwr(5, 1) apelt i5 5 * pwr(5, 0) apelt tl 1 Programarea calculatoarelor Curs 2 Marius Minea Programarea calculatoarelor Recursivitate 7 Remarcam, executand pas cu pas, si urmarind figura: - fiecare apel genereaza ‘in cascada" un alt apel, pana la cazul de baza - cand se ajunge la cazul de baza, toate apelurile sunt incepute si inca neterminate - fiecare apel isi urmeaza propria executie prin corpul functiei si are propriile valori pentru parametri Programarea calculatoarelor Curs 2 Marius Minea Programarea calculatoarelor Recursivitate 8 1 cazul de baza (conditia de oprire) - cel mai simplu caz pentru definitia (notiunea) respectiva Exemple: termenul initial dintr-un sir recurent cel mai mic obiect (un element, in cazul sirului) cea mai simpla actiune (un pas, in cazul drumului) 2 relatia de recurenta - defineste notiunea, folosind un caz mai simplu al aceleiasi notiuni 3 demonstratie (argument) de oprire a definitiei dupa nr finit de pasi (ex o cantitate nenegativa care descreste urmarind definitia) - pentru siruri: indicele (scade in definitie, e nenegativ) - pentru obiecte: dimensiunea (la fel, scade) Programarea calculatoarelor Curs 2 Marius Minea Programarea calculatoarelor Recursivitate 9 Ж77, 3 — an = a - a - - a (de n ori) - o fraza e o insiruire de cuvinte — un sir e un sir mai mic urmat de un alt sir mai mic - un sir e un caracter urmat de un sir O definitie recursiva trebuie sa fie bine formata (v conditiile 1-3) - ceva nu se poate defini doar in functie de sine insusi (ж =  (ж)) - se pot utiliza doar notiuni deja definite - nu se poate genera un calcul infinit (trebuie sa se opreasca) Programarea calculatoarelor Curs 2 Marius Minea Programarea calculatoarelor Recursivitate 10 crrirridc(a, 6) = !a a = b cmmdc(a — b,b) a > b cmmdc(a, b — a) a b ? cmmdc(a-b, b) : cmmdc(a, b-a); int main(void) { printf ("cmmdc(20, 8) e ° ou n" , cmmdc(20, 8)); return 0; - numerele unsigned se tiparesc folosind formatul ° ou - calculul e corect doar cu a si b nenule Pentru a trata si cazul zero: return a == 0 ? b : b == 0 ? a : a > b ? cmmdc(a-b, b) : cmmdc(a, b-a); Programarea calculatoarelor Curs 2 Marius Minea Programarea calculatoarelor Recursivitate 11 unsigned factl(unsigned n) return n == 0 ? 1 : n * factl(n-1);    varianta 2: apelata cu fact2(n, 1) unsigned fact2(unsigned n, unsigned res) return n == 0 ? res : fact2(n-l, n*res); v l: calcul facut la sfarsitul functiei, revenirea din apelul recursiv calcule succesive: 1*1 (1), 2*1 (2), 3*2 (6), 4*6 (24), 5*24 (120), etc v 2: functia primeste un rezultat partial, care e actualizat prin calcul si transmis mai departe (calcul de apelul recursiv); ajuns la cazul de baza, rezultatul e complet si e returnat pana sus apeluri (arg 2): 1, 5 (5*1), 20 (4*5), 60 (3*20), 120 (2*60), 120 (1*120) Programarea calculatoarelor Curs 2 Marius Minea Programarea calculatoarelor Recursivitate 12 factl(3) apel[ i6 3 * factl(2) apel[ i2 2 * factl(1) apel[ il 1 * factl(0) apel[ il 1 - apelul se face in calculul rezultatului -inmultirea: dupa revenirea din apel calcul: 3*(2*(1*1)) fact2(3, 1) apel[ i6 fact2(2, 3) apell i6 fact2(l, 6) apell i6 fact2(0, 6) apel[ i6 6 - calculul: inainte de apel (valoarea pt param, doi, cu rol de rezultat partial) - la revenire: se transmite rezultatul inapoi pana sus calcul: (((1*3)*2)*1) Programarea calculatoarelor Curs 2 Marius Minea Programarea calculatoarelor Recursivitate 13 Forma: sq = to, sn = sn i + in, pentru n > 0 (in = termenul general) Exemplu recursiv pentru seria armonica 1 1 + 1 2 + + 1 n #include double suma rec(unsigned n) { return n == 0 ? 0 : suma rec(n-1) + 1 0 n; int main(void) { printf ("suma pana la 1 100: ° of n", suma rec(100)) ; return 0; - am transcris direct definitia recursiva sq = to" sn = sn i + l n (n > 0) termenii se aduna incepand de la 1 1 la 1 100, la revenirea din apel -double: tip pentru numele reale in dubla precizie (tipul implicit pentru constante reale, folosit uzual in calcule, si in functiile standard) - tiparire cu formatul ° of (printf converteste si pe float la double) 1 0   n : operatie intre real si intreg : intregul convertit la real Programarea calculatoarelor Curs 2 Marius Minea Programarea calculatoarelor Recursivitate 14 Putem rescrie, ca si la fact2, transmitand mai departe suma partiala (calculata tot pornind invers, de la termenul de ordin cel mai mare) double suma inv(unsigned n, double rez) { return n == 0 ? rez : suma inv(n - 1, rez + 1 0 n); suma inv(n, rez) e suma primilor n termeni (inca necalculata), plus rezultatul rez deja calculat al termenilor din dreapta celui curent (in) - daca n = 0, totul e adunat deja in rez, care e returnat; - altfel, rezultatul e acelasi cu suma primilor n— 1 termeni (inca necalculata), plus rezultatul partial la care se adauga 1 n (termenul curent) Pentru calcul, se apeleaza cu rezultatul initial o : suma inv(100, 0 0) Pentru a simplifica folosirea de catre utilizator, se poate defini o functie cu un singur parametru, care o apeleaza pe aceasta ca functie auxiliara: double serie arinonica(unsigned n) { return suma inv(n, 0 0); } Programarea calculatoarelor Curs 2 Marius Minea Programarea calculatoarelor Recursivitate 15 Putem exprima recursiv calculele numerice cu aproximatii succesive Cazul de baza (oprirea) inseamna aici atingerea unei precizii suficiente - pentru radacina patrata y x avem: uq = 1, an | i = i>(an + ^-) - ne oprim din calcul atunci cand s-a atins precizia dorita |an | 1-an| double rad(double x, double a n) { return fabs(a n - x a n) neglijabil => ret suma curenta - recursiv: continua si returneaza suma calculata cu valori actualizate #include #include double e x(double x, unsigned n, double return fabs(t n l) F(n + 1) (daca F(n) adevarat atunci F(n + 1) adevarat) - recurenta defineste ceva "mai mare" prin ceva "mai mic" (se opreste cand dimensiunea (masura) notiunii definite scade la zero) Programarea calculatoarelor Curs 2 Marius Minea Programarea calculatoarelor Recursivitate 18 Multe elemente de limbaj pot fi oricat de complexe, dar au o structura riguros definita => se preteaza la definitii recursive -insiruiri liniare: un program are oricate functii, o functie are oricate argumente si instructiuni, etc - structuri mai complexe, ex expresie formata din operator si 2 expresii Structura ( ) limbajului se reprezinta uzual printr-o notatie standard numita BNF (Backus-Naur Form) Exemplu: antet-functie ::= tip identificator ( parametri ) parametri ::= void | lista-parametri lista-parametri ::= tip identificator | tip identificator , lista-parametri unde ::= denota definitie iar | alternativa (alegere) Cazuri particulare: recursivitate la stanga si la dreapta, dupa locul in care apare notiunea recursiva in corpul definitiei Programarea calculatoarelor Curs 2 Marius Minea 18 octombrie 2004 Programarea calculatoarelor 2 Curs 2 Marius Minea Tipuri Operatori Expresii 2 — : regulile gramaticale care descriu un limbaj un sir de simboluri (text) face parte din limbaj ? (e bine format ?) - : intelesul (semnificatia) unui obiect din limbaj rezulta din semnificatia fiecarui element de program in parte determina rezultatul executiei programului Definim sintaxa elementelor de limbaj folosind anumite notatii: ::= pentru definitie | pentru alternative etc Conventie: cursiv pentru simboluri neterminale (definite la randul lor) tiparit pentru simboluri terminale (elemente lexicale) instructiune while ::= while ( conditie ) instructiune BNF (Backus-Naur Form): notatie formala pt gramatica unui limbaj Programarea calculatoarelor 2 Curs 2 Marius Minea Tipuri Operatori Expresii 3 Prima faza de compilare: analiza lexicala = separarea in : = unitatile elementare de limbaj care au o semnificatie: - : int, void, while, etc - : nume de functii sau variabile: main, printf, x l = secventa de litere, cifre si care incepe cu o litera sau ATENtiE ! in C se face distinctie intre majuscule si minuscule !!! Lungimea semnificativa a identificatorilor: 31 (externi) 63 (interni) (portiunea suplimentara poate fi ignorata de unele compilatoare!) - : 123, 3 14, ’ o>, "salut ! n" etc - :+,-,=,++,&& etc - :{}(); etc Spatiile: necesare doar unde trebuie separati doi atomi lexicali alaturati ex voidmain sau fioatx=3 14; nesemnificative in rest programele pt citire usoara ! (automat in editoarele bune) Programarea calculatoarelor 2 Curs 2 Marius Minea Tipuri Operatori Expresii 4 Un : determina multimea valorilor pe care le poate lua o variabila, si operatiile care pot fi efectuate - reprezentate pe un numar de octeti => set de valori (chiar daca in matematica, domeniile pentru intregi si reali sunt nelimitate) => Atentie la depasiri !!! Limbajul C are doar cateva tipuri de baza - char: caractere, reprezentate pe 1 octet (8 biti) -int: numere intregi - float: numere reale (virgula mobila), in precizie simpla - double: numere reale, in dubla precizie Domeniul de valori pentru intregi si reali e dependent de arhitectura (de obicei, corespunde natural cu dimensiunea registrilor procesorului) Programarea calculatoarelor 2 Curs 2 Marius Minea Tipuri Operatori Expresii 5 Tipul int poate primi ca prefix calificatori care specifica: — : short, long (in C99 si long long) — : signed (implicit, in caz de omisiune), unsigned Cele doua se pot combina; int poate fi omis: (ex unsigned short) Standardul prevede (definitii in - int, short: > 2 octeti, minim [—215, 215 - 1] = [-32768, 32767] - long: > 4 octeti, acopera minim [—231 (-2147483648) , 231 — 1] - long long: > 8 octeti, acopera minim [—263, 263 — 1] - unsigned pastreaza dimensiunea; intre 0 si 286 — 1 (b = nr octeti) - sizeof(short) domeniul de valori e simetric fata de zero => precizia se defineste relativ la modulul numarului Exemple de dimensiuni (compilator gcc pe І386, sub Linux): - float: 4 octeti, intre cca iO-38 si iO38, 6 cifre semnificative - double: 8 octeti, intre cca io-308 si iO308, 15 cifre semnificative - pentru precizie suplimentara: long double (12 octeti) - contin mantisa, iar optional semn si exponent (prefix e sau E) -in mantisa, partea reala sau zecimala poate lipsi, dar nu amandoua - implicit, orice constanta reala e considerata double - sufix f sau F pentru float; 1 sau L pentru long double Exemple: 1 0 sau 1 sau lei 3 14159265358979323846 1 175494e-38f Programarea calculatoarelor 2 Curs 2 Marius Minea Tipuri Operatori Expresii 9 : valori minime cerute de standard SHRT MiN, iNT MiN -32767 SHRT MAX, iNT MAX 32768 LONG-MiN -2147483647 LONG MAX 2147483647 USHRT-MiN, UiNT MiN 65535 ULONG MAX 4294967295 Obs: pe gcc i386 Linux, int are aceleasi dimensiuni ca si long : valori pt gcc i386 Linux (si cerintele standard) FLT-DiG 6 FLT MiN FLT-MAX FLT-EPSiLON DBL-MiN DBL-MAX DBL EPSiLON DBL-DiG 15 (min 10)  * precizie 1 17549435e-38F (max 1E-37) 3 40282347e+38F (min 1E+37) 1 19209290e-07F (max 1E-5)  * nr min cu 2 2250738585072014e-308 (max 1E-37) 1 7976931348623157e+308 (min 1E+37) 2 2204460492503131e-16 (max 1E-9) zecimala *  1+eps > 1 *  Programarea calculatoarelor 2 Curs 2 Marius Minea Tipuri Operatori Expresii 10 - int (chiar long): domeniu de valori mic (cca ± 2 miliarde) - e insuficient pentru multe calcule care implica aparent intregi Ex calculati e x = 1 - т1  1! + x2 2  - cu o precizie data (iO-5) Nu incercati: long fact(long n)} {  * *  } (depasire pt n > 12) mai bine: fara factorial, cu recurenta intre termeni: in = in-i x n - pana la 9E15 tipul double distinge inca doi intregi consecutivi - o valoare citita de la intrare nu e reprezentata neaparat precis! float x; scanf ("° of", &x) ; printf ("° 0 7f" , x) ; 4 2 4 1999998 fractii exacte in baza 10 pot fi periodice in baza 2 1 2(10) = l (0011)(2) -in calcule matematice, adeseori comparatia == e insuficienta (pot apare pierderi de precizie pe parcurs) - mai bine: fabs(x - y) 1 Programarea calculatoarelor 2 Curs 2 Marius Minea Tipuri Operatori Expresii 11 Operatorul sizeof da numarul de octeti de memorie ocupati de operand (un tip de date sau o expresie - in particular o variabila) - daca operandul e un tip, trebuie pus intre ( paranteze ) - daca e o expresie, rezultatul e dat de tipul sau (fara evaluarea ei) #include void main (void) printf ("char t t° od n" , sizeof (char) ) ; printf ("short t t° od n" , sizeof (short) ) ; printf ("int t t° od n" , sizeof (int) ) ; printf ("long t t° 0d n" , sizeof (long) ) ; printf ("float t t° od n" , sizeof (float)) ; printf ("double t t° 0d n" , sizeof (double) ) ; printf ("long double t° 0d n" , sizeof (long double)); Programarea calculatoarelor 2 Curs 2 Marius Minea Tipuri Operatori Expresii 12 -operatorii uzuali binari: +, *,   pentru numere intregi si reale ATENtiE: pentru intregi,   inseamna impartire cu rest - operatorul ° 0 (numai pentru intregi): modulo (restul la impartire) 9 -5==-l 9° o-5==4 -9 5==-l -9° 05==-4 -9 -5==l -9° 0-5=-4 (restul are semnul deimpartitului) — operatorul unar - (minus; nu exista plus unar) in expresii aritmetice, caracterele sunt considerate ca si intregi (indicele caracterului respectiv in tabela ASCii) Exemplu: ’7’ - ’0’ == 7, ’a’ + 5 == 3i3 (cifrele, respectiv literele ocupa spatiu continuu in tabela de caractere) Precedenta: - unar, apoi *,  , ° 0, apoi +, - Programarea calculatoarelor 2 Curs 2 Marius Minea Tipuri Operatori Expresii 13 - C nu are tip boolean; se foloseste int (C99: Bool, stdbool h) - operatorii logici produc 1 pt true, 0 pt false - un intreg e interpretat ca true daca e 7^ 0 si ca false daca e 0 : precedenta mai mica decat cei aritmetici x , >=, se poate scrie natural (x determina semnul caracterelor cu bitul 7 pe 1, si implicit semnul la conversia char -> int la conversia comparatia intre int si unsigned !! valorile > iNT-MAX sunt considerate negative ca int => rezultate incorecte   surprinzatoare   neintuitive int i; unsigned u = 3000000000;  * u > iNT MAX *  i = u + 5;  * bitul de semn 1, deci i e considerat negativ *  if (i > u) printf ("° od > ° ou n", i, u) ;  * tipareste: -1294967291 > 3000000000 !!! *  Pentru a compara int i cu unsigned u -inlocuiti (i u) cu (i > o && i > u) Programarea calculatoarelor 2 Curs 2 Marius Minea Tipuri Operatori Expresii 16 : partea dreapta convertita la tipul partii stangi - e posibila trunchierea daca atribuim la un tip de dimensiune mai mica => mesaje de avertizare de la compilator Exemplu: int i; char c; i = с; c = i;  * valoarea se pastreaza *  c=i; i=c;  * bitii superiori se pierd *  : partea dreapta e evaluata independent de tipul partii stangi! unsigned eur rol = 41000, usd rol = 33500; float eur usd; eur usd = eur rol   usd rol;  * 1 !!! *  (engl type cast) Sintaxa: ( nume tip ) expresie expresia este convertita ca in atribuirea unei variabile de tipul dat eur usd = (double) eur rol   usd rol;  * 1 17 *  int n; sqrt((double)n);  * double sqrt(double) in math h *  Programarea calculatoarelor 2 Curs 2 Marius Minea Tipuri Operatori Expresii 17 propriu-zisa: var = expr (un operator ca oricare altul) => o expresie de atribuire poate fi folosita in alta expresie compusa (si valoarea ei e chiar cea a expresiei atribuite) a = b = c  * asociativ la dreapta, a = (b = c) *  if ((c = getcharO) != ’ n’) {  * folosim rezultatul in test *  } : Nu gresiti folosind atribuirea in loc de test de egalitate!! if (x = y) testeaza daca valoarea lui у (atribuita si lui x) e nenula : += = *=  = ° o= x += expr e o forma mai scurta de a scrie x = x + expr vezi ulterior si pentru operatorii pe biti " " &   prefix postfix: ++ — ++i incrementare cu 1, valoarea expresiei este cea de dupa atribuire i++ incrementare cu 1, valoarea expresiei este cea dinainte de atribuire int x=2, y, z; у = x++;  * y=2,x=3 * ; z = ++x;  * x=4,z=4 *  Programarea calculatoarelor 2 Curs 2 Marius Minea Tipuri Operatori Expresii 18 - numara caracterele din sirul s in variabila i for (i = 0; s[i] != ’ 0’; i++) ;  * sirul se termina cu ’ 0’ *  sau, cu un test implicit de valoare nonzero, si preincrement: for (i = -1; s [++i] ; );  * corpul lui for este vid *  - copiaza sirul src in sirul dest; expresia atribuita serveste si pt test for (i = j = 0; dest[j++] ; ); = src - copiaza max N caractere; cand primul test e fals, se omite al doilea (deci nu se mai executa atribuirea) for (i = j = 0; i o expresie care contine mai multi operatori cu efect lateral poate avea rezultat   efect nedeterminat Exemple eronate: int i = 0; printf ("° od 70d", i++, i++) ;  *0 1 sau 1 0 * ) ; (argumentele unei functii se pot evalua in orice ordine) while (sEi] b) ? a : b;  * max(a, b) *  printf ("Numarul este ° os n", (n ! ++ — - ( tip) * & (pt adrese) sizeof *   7 Asociativitate && i i 7 • • = += -= etc > : in caz de dubiu, si pentru lizibilitate, folositi parantezele ! Programarea calculatoarelor 2 Curs 2 Marius Minea Tipuri Operatori Expresii 24 in multe situatii frecvent intalnite in programe trebuie paranteze! - daca vrem sa atribuim o valoare si apoi sa o testam: while ((c = s [++i]) != ’ 0’) { * prelucram c cat e nenul * } dar: c = s[++i] != ’ 0’ ii da lui c o valoare booleana (0 sau 1) - daca vrem sa deplasam pe biti si apoi sa adunam: n = (hi void main(void) int a, b, c; printf("introduceti trei numere intregi a b c: "); scanf ("° od ° od ° od", &a, &b, &c) ;  * sau 70d70d70d (la fel) *  printf("Cel mai mic numar este "); if (a  * functii matematice *  #include void main(void) float a, b, c, bl, d, delta; printf("Coeficientii ecuatiei:  * ax'42+bx+c=0 *  scanf ("7of7of° of" , &a, &b, &c) ; bl = -b (2 0*a); delta = bl*bl - c a; if (delta == 0) printf ("Solutie dubla: 7of n", bl); else if (delta > 0) { d = sqrt(delta);  * radacina patrata *  printf ("Solutii: 7o lf si 7o lf n", bl+d, bl-d) ; } else  * delta 0 int n, p, x; p = 1;  * valoarea initiala, x la puterea 0 *  while (n > 0) {  * n = de cate ori mai trebuie inmultit cu x *  p = p * x;  * facem inmultirea *  n = n - 1;  * a ramas cu o inmultire mai putin de facut *  Utilizarea si programarea calculatoarelor Curs 2 Marius Minea introducere in limbajul C 7 do instructiune while ( expresieJogica );  * poate fi { compusa } *  - se executa instructiunea - se evalueaza expresia - daca expresia e adevarata, se revine la executia instructiunii - daca expresia e falsa, ciclul se incheie Exemplu: char raspuns; do { printf("Apasati 3d’ pentru a continua: scanf (  7oC", feraspuns);  * citeste caracter, sare peste spatii *  } while (raspuns != ’d’);  * pana la raspunsul dorit *  Obs: in Pascal, din repeat until se iese pe conditie true (invers!) Utilizarea si programarea calculatoarelor Curs 2 Marius Minea introducere in limbajul C 8 exp imt; while (exp test) { instructiune; exp cont; while (n > 0) { p = p * x; n = n - 1; for (expJnit ; exptest ; expcont) instructiune e echivalenta* cu: * exceptie: instructiunea continue, vezi ulterior Calculul puterii: for (p = 1; n > 0; n = n - 1) p = p * x; - oricare din cele 3 expresii poate lipsi (dar cele doua ; raman) - daca exp test lipseste, e tot timpul adevarata (ciclu infinit) Cel mai simplu si frecvent caz: cand stim numarul de iteratii: int i;  * variabila cu care numaram iteratiile *  for (i = 0; i 0);  * ultima cifra e restul impartirii *   * avansam pentru urmatoarea cifra *   * impartire cu rest !! *   * i e numarul de cifre *  } while (i > 0);  * prima cifra e la pozitia i - 1 *   * ultima cifra e la pozitia 0 *  Utilizarea si programarea calculatoarelor Curs 2 Marius Minea introducere in limbajul C 12 Exista tablouri de oricate dimensiuni Pentru 2: matrici: int m ; interpretare: tablou de 10 elemente, fiecare un tablou de 7 intregi void main(void) { int i, j, m , sumcol ;  * matrice si suma pe coloane *  printf("Dati pe linii si coloane o matrice 5x3 de intregi n"); for (i = 0; i set de valori (chiar daca in matematica, domeniile pentru intregi si reali sunt nelimitate) => Atentie la depasiri !!! Limbajul C are doar cateva tipuri de baza - char: caractere, reprezentate pe 1 octet (8 biti) signed char: -128 127 unsigned char: 0 255 char poate corespunde la oricare din ele, conform standardului -int: numere intregi - float: numere reale (virgula mobila), in precizie simpla - double: numere reale, in dubla precizie Domeniul de valori pentru intregi si reali e dependent de arhitectura (de obicei, corespunde natural cu dimensiunea registrilor procesorului) Programarea calculatoarelor 2 Curs 2a Marius Minea Reprezentarea intregilor Operatori pe biti 3 in memoria calculatorului, numerele se reprezinta in binar (baza 2) Valoarea unui , cu к cifre binare (biti): ck-xck-2       cic0 (2) = ck-x * 2fe 1 + + ci * 21 + c0 * 2° Cfc l = bitul ce! mai semnificativ (superior) c0 = bitul cel mai putin semnificativ (inferior) Exemplu (pe 8 biti): 11111111(2) == 255 reprezentati in daca bitul superior e 1, numarul se considera negativ valoarea: translatata cu 2k in jos fata de interpretarea fara semn lCfc-2   •   C1C0 (2) = -2fc 1 + ck-2 * 2fc 2 + + Ci * 21 + c0 * 2° Exemple (pe 8 biti): 11111111(2) == -1; 10000000(2) == -128 Adunarea se poate face normal, bit cu bit, indiferent de reprezentare Test de depasire: int x, y, s; scanf ("o odo od", &x, &y); s = x + y; if (x = 0 || x > 0 && у > 0 && s 2 octeti, minim [—215, 215 - 1] = [-32768, 32767] - long: > 4 octeti, acopera minim [—231 (-2147483648) , 231 — 1] - long long: > 8 octeti, acopera minim [—263, 263 — 1] - unsigned pastreaza dimensiunea; intre 0 si 286 — 1 (b = nr octeti) - sizeof(short) (valori minime cerute de standard) SHRT-MiN, iNT-MiN -32767 LONG-MiN -2147483647 USHRT MAX, UiNT MAX 65535 SHRT-MAX, iNT-MAX 32768 LONG-MAX 2147483647 ULONG MAX 4294967295 Programarea calculatoarelor 2 Curs 2a Marius Minea Reprezentarea intregilor Operatori pe biti 5 -in baza 10: scrise obisnuit; ex -5 -in baza 8: cu prefix cifra zero; ex 0177 (127 zecimal) -in baza 16: cu prefix 0x sau 0X; ex 0xA9 (169 zecimal) — sufix u sau U pentru unsigned, ex 65535u - sufix 1 sau L pentru long ex 0177777L - caractere tiparibile, intre ghilimele simple: ’0’, 3!’, ’a’ - caractere speciale: ’ 0’ nuli ’ n’ linie noua ’ a’ alarm ’ r’ carriage return ’ b’ backspace ’ f’ form feed ’ t’ tab apostrof (ghilimea) ’ v’ vertical tab ’W backslash - caractere scrise in octal (max 3 cifre), ex: ’ 14’ - caractere scrise in hexazecimal (prefix x), ex Programarea calculatoarelor 2 Curs 2a Marius Minea Reprezentarea intregilor Operatori pe biti 6 ASCii = American Standard Code for information interchange Caracterele sunt memorate ca si cod numeric = indicele in acest tabel ex ’0’ == 48, ’A’ = 65, ’a’ = 97, etc 0123456789ABCDEF 0x0  0  a  b  t  n  v  f  r 0x10: 0x20: ! " # s % & ’ ()*+,-   0x30: 0123456789: ; ? 0x40: OABCDEFGHiJKLMNO 0x50: PQRSTUVWXYZ [   ]   0x60: ‘abcdefghijklmno 0x70: pqrstuvwxyzf | } - caracterele 0x7f (127): nu fac parte din setul ASCii (diacritice, diverse variante nationale standardizate de iSO, etc ) Programarea calculatoarelor 2 Curs 2a Marius Minea Reprezentarea intregilor Operatori pe biti int isalnum(int c) int isalpha(int c) int isblank(int c) int iscntrl(int c) int isdigit(int c) int isgraph(int c) int islower(int c) int isprint(int c) int ispunct(int c) int isspace(int c)  * "spatii albe" *  int isupper(int c) int isxdigit(int c) int tolower(int c) (isalpha(c) (’A’    a - z -> int toupper(int c) Programarea calculatoarelor 2 Curs 2a 7 ii isdigit(c)) с int main (void) printf ("char t t° od n" , sizeof (char) ) ; printf ("short t t° 0d n" , sizeof (short) ) ; printf ("int t t° od n" , sizeof (int) ) ; printf ("long t t° 0d n" , sizeof (long) ) ; return 0; C99 defineste in : int8 t,uint8 t, intl6 t,uintl6 t, int32 t,uint32 t, int64 t,uint64 t Programarea calculatoarelor 2 Curs 2a Marius Minea Reprezentarea intregilor Operatori pe biti 9 -operatorii uzuali binari: +, *,   pentru numere intregi si reale ATENtiE: pentru intregi,   inseamna impartire cu rest - operatorul ° 0 (numai pentru intregi): modulo (restul la impartire) 9 -5==-l 9° o-5==4 -9 5==-l -9° 05==-4 -9 -5==l -9° 0-5=-4 (restul are semnul deimpartitului) — operatorul unar - (minus; nu exista plus unar) in expresii aritmetice, caracterele sunt considerate ca si intregi (indicele caracterului respectiv in tabela ASCii) Exemple: ’7’ - ’0’ == 7, ’a’ + 5 == 3i3 (cifrele, literele mari, literele mici: 3 grupuri continue in tablela ASCii) Conversii: litjnica = litjnare + ’a’ - ’A’; cifra = valoare + ’O’; Precedenta: - unar, apoi *   ° 0, apoi + - Programarea calculatoarelor 2 Curs 2a Marius Minea Reprezentarea intregilor Operatori pe biti 10 - ofera acces direct la reprezentarea binara a datelor in memorie, cu posibilitati apropiate limbajului de asamblare - pot fi aplicati doar operanzilor de tipuri intregi, cu sau fara semn & si bit cu bit i SAU bit cu bit   SAU exclusiv bit cu bit   complementare bit cu bit " deplasare la stanga " deplasare la dreapta De obicei testam, setam, resetam sau inversam bitul к dintr-un numar Cream un numar (2fc) care are 1 pe bitul к si in rest 0 : 1 " к Testare n & (1 " k) nenul daca bitul к din n e 1 Setare n = n (1 " k) bitul Resetare n = n &  (1 set de valori (chiar daca in matematica, domeniile pentru intregi si reali sunt nelimitate) => Atentie la depasiri !!! Limbajul C are doar cateva tipuri de baza - char: caractere, reprezentate pe 1 octet (8 biti) signed char: -128 127 unsigned char: 0 255 char poate corespunde la oricare din ele, conform standardului - int: numere intregi - float: numere reale (virgula mobila), in precizie simpla - double: numere reale, in dubla precizie Domeniul de valori pentru intregi si reali e dependent de arhitectura (de obicei, corespunde natural cu dimensiunea registrilor procesorului) Programarea calculatoarelor 2 Curs 2a Marius Minea in memoria calculatorului, numerele se reprezinta in binar (baza 2) Valoarea unui , cu к cifre binare (biti): c , 1c , 2 cico (2) = cfc-l * 2fc 1 + + ci * 21 + c0 * 2° ck x = bitul cei mai semnificativ (superior) cq = bitul cel mai putin semnificativ (inferior) Exemplu (pe 8 biti): 11111111(2) == 255 : reprezentat! in daca bitul superior e 1, numarul se considera negativ valoarea: translatata cu 2fe in jos fata de interpretarea fara semn lcfc-2 • • • cico (2) = —2fe 1 + c c 2 * 2 u 2 + ••• + и * 21 + cq * 2° Exemple (pe 8 biti): 11111111(2) ==-1; 10000000(2) ==-128 Adunarea se poate face normal, bit cu bit, indiferent de reprezentare Test de depasire: int x, y, s; scanf ("%d%d", &x, &y); s = x + y; if (x = 0 || x>0&&y>0&&s 2 octeti, minim [—215, 215 - 1] = [-32768, 32767] - long: > 4 octeti, acopera minim [—231 (-2147483648) , 231 — 1] - long long: > 8 octeti, acopera minim [—263, 263 - 1] - unsigned pastreaza dimensiunea; intre 0 si 286- 1 (b = nr octeti) - sizeof(short) (valori minime cerute de standard) SHRT MiN, iNT MiN -32767 LONG MiN -2147483647 USHRT MAX, UiNT MAX 65535 Programarea calculatoarelor 2 Curs 2a SHRT MAX, iNT MAX 32768 LONG MAX 2147483647 UL0NG MAX 4294967295 - caractere tipari bile, intre ghilimele simple: ’ 0’, ’ ! ’, ’a’ - caractere speciale: ’ o’ nuli ’ n’ linie noua ’ a’ alarm ’ r’ carriage return ’ b’ backspace ’ f’ form feed ’ t ’ tab apostrof (ghilimea) ’ v’ vertical tab ’W’ backslash - caractere scrise in octal (max 3 cifre), ex: ’ 14’ - caractere scrise in hexazecimal (prefix x), ex ’ xff’ ASCii = American Standard Code for information interchange Caracterele sunt memorate ca si cod numeric = indicele in acest tabel ex '0' == 48, ’A’ = 65, 'a' = 97, etc 0 1 2 3 4 5 6 7 8 9 A В c D E F 0x0  0  a  b  t  n  v  f  r 0x10: 0x20: # s % & ’ ( ) + + -   0x30: 0 1 2 3 4 5 6 7 8 9 ? 0x40: A В c D E F G H i J К L M N 0 0x50: p Q R s T U V W X Y z L   ] - 0x60:     a b c d e f g h i j к 1 m n 0 0x70: p q r s t U V w X У z { } - - caracterele 0x7f (127): nu fac parte din i setul ASCii (diacritice, diverse variante nationale standardizate de iSO, etc ) Programarea calculatoarelor 2 Curs 2a Marius Minea Marius Minea Programarea calculatoarelor 2 Curs 2a Marius Minea Reprezentarea intregilor Operatori pe biti Reprezentarea intregilor Operatori pe biti Reprezentarea intregilor Operatori pe biti int isalnum(int c) int isalpha(int c) int isblank(int c) int iscntrl(int c) int isdigit(int c) int isgraph(int c) int islower(int c) int isprint(int c) int ispunct(int c) int isspace(int c)  * * "spatii albe" *  int isupper(int c) int isxdigit(int c) int tolower(int c) int toupper(int c) (isalpha(c) || isdigit(c)) (’A’ a - z, restul neschimbat    a - z -> A - Z, restul neschimbat Operatorul da numarul de de memorie ocupati de operand (un tip de date sau o expresie - in particular o variabila) - daca operandul e un tip, trebuie pus intre ( paranteze ) - daca e o expresie, rezultatul e dat de tipul sau (fara evaluarea ei) #include int main (void) printf("char t t%d n",sizeof(char)); printf("short t t%d n",sizeof(short)); printf("int t t%d n",sizeof(int)); printf("long t t%d n",sizeof(long)); return 0; C99 defineste ІП : Programarea calculatoarelor 2 Curs 2a int8 t,uint8 t,intl6 t,uintl6 t, int32 t,uint32 t, int64 t,uint64 t Programarea calculatoarelor 2 Curs 2a Marius Minea -operatorii uzuali binari: +, -, +,   pentru numere intregi si reale ATENTiE: pentru intregi,   inseamna impartire cu rest - operatorul % (numai pentru intregi): moduio (restul la impartire) 9 -5==-l 9%-5==4 -9 5==-l -9%5==-4 -9 -5==l -9%-5=-4 (restul are semnul deimpartitului) - operatorul unar - (minus; nu exista plus unar) in expresii aritmetice, caracterele sunt considerate ca si intregi (indicele caracterului respectiv in tabela ASCii) Exemple: ’7’ - ’0’ == 7, ’a’ + 5 == ’f’ (cifrele, literele mari, literele mici: 3 grupuri continue in tablela ASCii) Conversii: lit mica = lit mare + ’a’ - ’A’; cifra = valoare + ’0’; Precedenta: - unar, apoi *   %, apoi + - Programarea calculatoarelor 2 Curs 2a Marius Minea Reprezentarea intregilor Operatori pe biti Reprezentarea intregilor Operatori pe biti Reprezentarea intregilor Operatori pe biti - ofera acces direct la reprezentarea binara a datelor in memorie, cu posibilitati apropiate limbajului de asamblare - pot fi aplicati doar operanzilor de tipuri intregi, cu sau fara semn & si bit cu bit i SAU bit cu bit " SAU exclusiv bit cu bit   complementare bit cu bit " deplasare la stanga " deplasare la dreapta De obicei testam, setam, resetam sau inversam bitul к dintr-un numar Cream un numar (2fe) care are 1 pe bitul к si in rest 0 : 1 " к Testare n & (1 " k) nenul daca bitul к din n e 1 Setare n = n i (1 " k) bitul к din n devine 1, ceilalti neschimbat! Resetare n = n &  (1 " k) bitul к din n devine 0, ceilalti neschimbat! inversare n = n   (1 " k) bitul к din n se schimba, ceilalti nu • n & OxF are ultimii 4 biti mai putin semnificativi la fel ca n, restul 0 (pentru n fara semn, echivalent cu n % 16; n & 1 == n % 2) • n i 0200 are bitul 7 pe 1, si toti ceilalti biti la fel ca n • n " 1 are ultimul bit schimbat fata de n, toti ceilalti la fel •  o == -1 : intreg cu toti bitii 1 •  0u == UiNT MAX : intreg (unsigned) cu toti bitii 1 • n domeniul de valori e simetric fata de zero => precizia se defineste relativ la modulul numarului Exemple de dimensiuni (compilator gcc pe І386, sub Linux): - float: 4 octeti, intre cca iO-38 si iO38, 6 cifre semnificative - double: 8 octeti, intre cca io-308 si iO308, 15 cifre semnificative - pentru precizie suplimentara: long double (12 octeti) - contin mantisa, iar optional semn si exponent (prefix e sau E) mantisa poate fi si in baza 16, iar exponentul in baza 2: prefix p sau P -in mantisa, partea reala sau zecimala poate lipsi, dar nu amandoua - implicit, orice constanta reala e considerata double - sufix f sau F pentru float; 1 sau L pentru long double Exemple: 1 0 sau 1 sau lei 3 14159265358979323846 1 175494e-38f Programarea calculatoarelor 2 Curs 2b Marius Minea Reprezentarea realilor Operatori Expresii 4 Constante limita definite in float h valori pt gcc i386 Linux (in paranteza cerintele minime standard) FLT DiG 6    precizie in cifre zecimale pt float DBL-DiG 15 (min 10)    precizie pentru double FLT MAX 3 40282347e+38F (min 1E+37)    max reprezentabil FLT MiN 1 17549435e-38F (max 1E-37)    min reprez in modul FLT EPSiLON 1 19209290e-07F (max 1E-5)    nr min cu 1+eps > 1 1 are mantisa: (l )000 000 (23 biti de mantisa) Urmatorul numar reprezentabil are mantisa: (l )000 001 Din diferenta (2-23   iO-7) rezulta valoarea flt epsilon, si flt dig Precizia e , data de flt epsilon * marimea numarului - float poate reprezenta numere mai mari decat int (si subunitare), dar precizia de ex pt numere de iO9 e flt epsilon *109   100 - pe int32 t se pot reprezenta toti intregii dar numai pana la   ±2*109 DBL MAX 1 7976931348623157e+308 (min 1E+37) DBL MiN 2 2250738585072014e-308 (max 1E-37) DBL EPSiLON 2 2204460492503131e-16 (max 1E-9) Programarea calculatoarelor 2 Curs 2b Marius Minea Reprezentarea realilor Operatori Expresii 5 - int (chiar long): domeniu de valori mic (cca ± 2 miliarde) - e insuficient pentru multe calcule care implica aparent intregi Ex calculati e x = 1 - ж1  1! + x2 2  - cu o precizie data (iO-5) Nu incercati: long fact(long n)} {  * *  } (depasire pt n > 12) mai bine: fara factorial, cu recurenta intre termeni: in = in i * x n - pana la 9E15 tipul double distinge inca doi intregi consecutivi - o valoare citita de la intrare nu e reprezentata neaparat precis! float x; scanf ("° of", &x) ; printf ("° 0 7f" , x) ; 4 2 4 1999998 fractii exacte in baza 10 pot fi periodice in baza 2 1 2(10) = l (0011)(2) -in calcule matematice, adeseori comparatia == e insuficienta (pot apare pierderi de precizie pe parcurs) - mai bine: fabs(x - y) , >=, se poate scrie natural (x determina semnul caracterelor cu bitul 7 pe 1, si implicit semnul la conversia char -> int la conversia comparatia intre int si unsigned !! valorile > iNT-MAX sunt considerate negative ca int => rezultate incorecte   surprinzatoare   neintuitive int i; unsigned u = 3000000000;  * u > iNT MAX *  i = u + 5;  * bitul de semn 1, deci i e considerat negativ *  if (i > u) printf ("° od > ° ou n", i, u) ;  * tipareste: -1294967291 > 3000000000 !!! *  Pentru a compara int i cu unsigned u -inlocuiti (i u) cu (i > o && i > u) Programarea calculatoarelor 2 Curs 2b Marius Minea Reprezentarea realilor Operatori Expresii 9 : partea dreapta convertita la tipul partii stangi - e posibila trunchierea daca atribuim la un tip de dimensiune mai mica => mesaje de avertizare de la compilator Exemplu: int i; char c; i = с; c = i;  * valoarea se pastreaza *  c=i; i=c;  * bitii superiori se pierd *  : partea dreapta e evaluata independent de tipul partii stangi! unsigned eur rol = 36000, usd rol = 30000; float eur usd; eur usd = eur rol   usd rol;   1 !!! (engl type cast) Sintaxa: ( nume tip ) expresie expresia este convertita ca in atribuirea unei variabile de tipul dat eur usd = (double) eur rol   usd rol;    1 2 int n; sqrt((double)n);  * double sqrt(double) in math h *  Programarea calculatoarelor 2 Curs 2b Marius Minea Reprezentarea realilor Operatori Expresii 10 propriu-zisa: var = expr (un operator ca oricare altul) => o expresie de atribuire poate fi folosita in alta expresie compusa (si valoarea ei e chiar cea a expresiei atribuite) a = b = c  * asociativ la dreapta, a = (b = c) *  if ((c = getcharO) != ’ n’) {  * folosim rezultatul in test *  } : Nu gresiti folosind atribuirea in loc de test de egalitate!! if (x = y) testeaza daca valoarea lui у (atribuita si lui x) e nenula : += = *=  = ° o= x += expr e o forma mai scurta de a scrie x = x + expr vezi ulterior si pentru operatorii pe biti & i   " > prefix postfix: ++ — ++i incrementare cu 1, valoarea expresiei este cea atribuire i++ incrementare cu 1, valoarea expresiei este cea de atribuire int x=2, y, z; у = x++;  * y=2,x=3 * ; z = ++x;  * x=4,z=4 *  Programarea calculatoarelor 2 Curs 2b Marius Minea Reprezentarea realilor Operatori Expresii 11 - numara caracterele din sirul s in variabila i for (i = 0; s[i] != ’ 0’; i++) ;  * sirul se termina cu ’ 0’ *  sau, cu un test implicit de valoare nonzero, si preincrement: for (i = -1; s [++i] ; );    ultima ; inseamna corp vid pentru for - copiaza sirul src in sirul dest; expresia atribuita serveste si pt test for (i = 0; dest [i] = src[i]; ++i); - copiaza max N caractere; cand primul test e fals, se omite al doilea (deci nu se mai executa atribuirea) for (i = 0; i expresii cu mai multe efecte laterale pot avea efect nedeterminat, int i = 0; printf ("° od 7od", i++, i++);    scrie 0 1 sau 1 0 (argumentele unei functii se pot evalua in orice ordine !!) while (s Ei] b) ? a : b;  * max(a, b) *  printf ("Numarul este ° os n", (n 9?v-10+ ’A’ : v + ’O’);    scrie cifra hexa Sintaxa: exprl , expr2  * operatorul este virgula *  - se evalueaza exprl, apoi expr2; rezultatul e dat de expr2 - se foloseste cand e nevoie de mai multe evaluari, dar sintaxa prevede o singura expresie (de ex in if, for, while) Exemple: for (p = 1, i = j = 0; i ! ++ — - ( tip) * & (pt adrese) sizeof *   7 Asociativitate && i i 7 • • = += -= etc > : in caz de dubiu, si pentru lizibilitate, folositi parantezele ! Programarea calculatoarelor 2 Curs 2b Marius Minea Reprezentarea realilor Operatori Expresii 15 in multe situatii frecvent intalnite in programe trebuie paranteze! - daca vrem sa atribuim o valoare si apoi sa o testam: while ((c = s [++i]) != ’ 0’) { * prelucram c cat e nenul * } dar: c = s[++i] != ’ 0’ ii da lui c o valoare booleana (0 sau 1) - daca vrem sa deplasam pe biti si apoi sa adunam: n = (hi domeniul de valori e simetric fata de zero => precizia se defineste relativ la modulul numarului Exemple de dimensiuni (compilator gcc pe 1386, sub Linux): - float: 4 octeti, intre cca 10-38 si 1038, 6 cifre semnificative - double: 8 octeti, intre cca ю-308 si 10308, 15 cifre semnificative - pentru precizie suplimentara: long double (12 octeti) - contin mantisa, iar optional semn si exponent (prefix e sau E) mantisa poate fi si in baza 16, iar exponentul in baza 2: prefix p sau P -in mantisa, partea reala sau zecimala poate lipsi, dar nu amandoua - implicit, orice constanta reala e considerata double - SUfiX f sau F pentru float; 1 sau L pentru long double Exemple: i o sau 1 sau lei 3 14159265358979323846 1 175494e-38f Programarea calculatoarelor 2 Curs 2b Marius Minea Reprezentarea realilor Operatori Exore+i Constante limita definite in float h valori pt gcc i386 Linux (in paranteza cerintele minime standard) FLT DiG 6    precizie in cifre zecimale pt float DBL DiG 15 (min 10)    precizie pentru double FLT MAX 3 40282347e+38F (min 1E+37)    max reprezentabil FLT MiN 1 17549435e-38F (max 1E-37)    min reprez in modul FLT EPSiL0N 1 19209290e-07F (max 1E-5)    nr min cu 1+eps > 1 1 are mantisa: (1 )ooo 000 (23 biti de mantisa) Urmatorul numar reprezentabil are mantisa: (1 )ooo 001 Din diferenta (2-23   10-7) rezulta valoarea flt epsilon, si flt dig Precizia e , data de flt epsilon * marimea numarului - float poate reprezenta numere mai mari decat int (si subunitare), dar precizia de ex pt numere de 109 * * * * e flt epsilon *109  100 - pe int32 t se pot reprezenta tot  intregii dar numai pana la   ±2* 109 DBL MAX 1 7976931348623157e+308 (min 1E+37) DBL MiN 2 2250738585072014e-308 (max 1E-37) DBL EPSiL0N 2 2204460492503131e-16 (max 1E-9) Programarea calculatoarelor 2 Curs 2b Marius Minea - int (chiar long): domeniu de valori mic (cca ± 2 miliarde) - e insuficient pentru multe calcule care implica aparent intregi Ex calculati e x = 1 - x1 !1 + x2 * * 2! — cu o precizie data (10-5) Nu incercati: long fact(long n)i {  * *  } (depasire pt n > 12) mai bine: fara factorial, cu recurenta intre termeni: in = in i * x n - pana la 9E15 tipul double distinge inca doi intregi consecutivi - o valoare citita de la intrare nu e reprezentata neaparat precis! float x; scanf ("%f", &x) ; printf ("% 7f" , x) ; 4 2 —> 4 1999998 fractii exacte in baza 10 pot fi periodice in baza 2 1 2(10) = l (0011)(2) -in calcule matematice, adeseori comparatia == e insuficienta (pot apare pierderi de precizie pe parcurs) - mai bine: fabs(x - y) , >=, se poate scrie natural (x determina semnul caracterelor cu bitul 7 pe 1, si implicit semnul la conversia char -> int la conversia comparatia intre int si unsigned i! valorile > int max sunt considerate negative ca int => rezultate incorecte   surprinzatoare   neintuitive int i; unsigned u = 3000000000;  + u > iNT MAX +  i = u + 5;  * bitul de semn 1, deci i e considerat negativ *  if (i > u) printf("%d > %u n", i, u);  * tipareste: -1294967291 > 3000000000 !!! *  Pentru a compara int i cu unsigned u -inlocuiti (i u) CU (i > 0 && i > u) Programarea calculatoarelor 2 Curs 2b Marius Minea : partea dreapta convertita la tipul partii stangi - e posibila trunchierea daca atribuim la un tip de dimensiune mai mica => mesaje de avertizare de la compilator Exemplu: int i; char c; i = с; c = i;  + valoarea se pastreaza +  c = i; i = c;  + bitii superiori se pierd +  : partea dreapta e evaluata independent de tipul partii stangi! unsigned eur rol = 36000, usd rol = 30000; float eur usd; eur usd = eur rol   usd rol;    1 !!! (engl type cast) Sintaxa: ( nume tip ) expresie expresia este convertita ca in atribuirea unei variabile de tipul dat eur usd = (double) eur rol   usd rol;    1 2 int n; sqrt((double)n);  + double sqrt(double) in math h +  Programarea calculatoarelor 2 Curs 2b Marius Minea Reprezentarea realilor Operator' Expresii 10 Reprezentarea realilor Operatori Expresii Reprezentarea realilor Operatori Expresii propriu-zisa: var = expr (un operator ca oricare altul) => o expresie de atribuire poate fi folosita in alta expresie compusa (si valoarea ei e chiar cea a expresiei atribuite) a = b = c  + asociativ la dreapta, a = (b = c) +   if ((c = getcharO) != ’ n’) {   + folosim rezultatul in test +  } : Nu gresiti folosind atribuirea in loc de test de egalitate!! if (x = y) testeaza daca valoarea lui у (atribuita si lui x) e nenula x += expr e o forma mai scurta de a scrie x = x + expr vezi ulterior si pentru operatorii pe biti & i   " > prefix postfix: ++ — ++i incrementare cu 1, valoarea expresiei este cea atribuire i++ incrementare cu 1, valoarea expresiei este cea de atribuire int x=2, y, z; у = x++;  + y=2,x=3 + ; z = ++x;  + x=4,z=4 +  Programarea calculatoarelor 2 Curs 2b Marius Minea - numara caracterele din sirul s in variabila i for (i = 0; s [i] != ’ 0’; i++);  * sirul se termina cu ’ 0’ *  sau, cu un test implicit de valoare nonzero, si preincrement: for (i = -1; s [++i]; );    ultima ; inseamna corp vid pentru for - copiaza sirul src in sirul dest; expresia atribuita serveste si pt test for (i = 0; dest [i] = src [i] ; ++i) ; - copiaza max N caractere; cand primul test e fals, se omite al doilea (deci nu se mai executa atribuirea) for (i = 0; i expresii cu mai multe efecte laterale pot avea efect int 1=0; printf("%d %d", 1++, 1++);    scrie 0 1 sau 1 0 (argumentele unei functii se pot evalua in orice ordine !!) while ! ++ — - (tip) * & (pt adrese) sizeof *   % Asociativitate Exemple: m = (a > b) ? a b;  * max(a, b) *  printf("Numarul este %s n", (n 9?v-10+ ’A’    scrie cifra hexa & Sintaxa: exprl , expr2  * operatorul este virgula +  - se evalueaza exprl, apoi expr2', rezultatul e dat de expr2 - se foloseste cand e nevoie de mai multe evaluari, dar sintaxa prevede o singura expresie (de ex in if, for, while) Exemple: for (p = 1, i = j =0; i noii liste) si o (=> noii liste) Mai scurt, scriem valori lista intre cu intre elemente: [ ; ; : ; ] Lista e un tip de date mai precis, avem (gr "mai multe forme"), (introdus in ML, 1975) cate un tip lista pentru fiecare tip de element, dat ca parametru int list, string list, etc Un tip cu variante (lista vida   cap+coada) e prelucrat prin (cu un tipar pentru fiecare varianta) Prin potrivirea de tipare descompunem un obiect dupa identificand (si numind) partile componente Doua scrieri: П -> exprl cap : : coada -> expr2 cu lista : stanga (lista) -> dreapta expresie-lista i П -> exprl i cap : : coada -> expr2 cu expresiilor din dreapta Valoarea functiei sau expresiei e cea a lui exprl daca lista e vida; altfel, identificatorii cap si coada sunt la cele doua parti ale listei, si pot fi folositi in expr2, care da rezultatul intregii expresii Bara i la prima varianta e optionala dar poate face codul mai usor de citit Cand argumentul lista e ultimul, e mai concis: x = i [] -> X i h :: -> x + h Altfel, putem folosi istl lst2 = istl i П lst2 i h : : -> h :: lst2 Tiparul se potriveste cu orice Folosim pentru a ignora valoarea Modulul are multe functii pentru lucrul cu liste Le folosim cu numele List numefunctie Functiile cele mai simple: (head) si returneaza capul, si respectiv coada listei List hd ;; - : int = 1 List tl ;; - : int list = (ta  ) Functiile si nu sunt definite pentru lista vida (sunt pe tipul lista) La apel cu П ele (Vom discuta in alt curs despre ) List,hd П;; Exception: Failure List tl П ;; Exception: Failure Folosind potrivirea de tipare, putem scrie functie cu liste inclusiv cele pentru cap si coada: i П failwith | П failwith i h :: h | : t -> t intr-o functie, trebuie sa tratam Folosind potrivirea de tipare (cu sau ) si ne asigura ca nu am uitat nicio varianta Folosind si trebuie sa ne asiguram noi ca nu avem lista vida Preferam de aceea accesul la cap coada prin i П -> о i :: t -> 1 + len t Varianta: in parcurgere, acumulam rezultatul partial inca un parametru: elementele numarate pana acum r = i П -> r i :: t -> len2 (r+1) t ist = len2 O ist (initial, nu am numarat niciun element, de aici argumentul 0) Modulul defineste functia Functia e ajutatoare si nu va fi folosita direct r = i П -> r i :: t -> len2 (r+1) t ist = len2 0 ist Putem rescrie: ist = r = i П -> r i :: t -> len2 (r+1) t len2 0 ist Putem citi in felul urmator: ist = len2 0 ist unde definitia functiei e data (si vizibila) doar in interior Doar functia e recursiva, nu si (doar foloseste ) Comparam cele doua variante: i [] -> 0 i :: t -> 1 + len t adunare la revenirea din apel (calcul pentru rezultatul final) ist = r = i [] -> r i :: t -> len2 (r+1) t len2 0 ist adunare la arg de apel rezultatul retransmis Preferam varianta 2: Apelul recursiv e operatie pe acea ramura ( ) => fiecare apel recursiv returneaza ca cel anterior Compilatorul poate apelul in (ciclu) Varianta 1 poate esua pe liste lungi, consumand memorie pe stiva proportional cu lungimea listei Apare valoarea x in lista ? x = i П false i h :: t -> x = h || mem x t val mem : ’a -> ’a list -> bool = x e membru in lista daca: x e capul listei h, SAU x e membru in coada listei t Operatorul i i: SAU logic: cel putin un operand adevarat (true) daca primul e true, rezultatul e true nu mai evalueaza al doilea e deasemenea o functie predefinita E natural sa unei liste Distingem trei cazuri principale 1 fiecare element al listei cu aceeasi functie obtinem o noua lista 2 ceva pentru fiecare element (ex tiparim) (fara a produce vreo valoare ca rezultat) 3 toate valorile din lista (le acumulam succesiv intr-un rezultat) Acestea sunt pentru liste (a itera = a repeta) Scriem doar functia pentru de prelucrare (un element), iar lista e de functiile standard de iterare : (’a -> ’b) -> ’a list -> ’b list List map [el; e2; en] e lista [f el; f e2; f en] Rezultatul lui f poate avea alt tip decat parametrul putem obtine o lista cu alt tip de elemente f = i [] -> [] i h :: t -> f h :: map f t sau, cu o functie auxiliara f = i [] -> [] i h :: t -> f h :: mapl t mapl б2 Г2 List map ((+) 2) List map String length [ - : int list = : (’a -> unit) -> ’a list -> unit List iter f [el; e2; en] apeleaza f el; f e2; f en Functia f: folosita pentru (ex tiparire), nu valoarea ei ML are tipul , cu singura valoare notata (C are void) f = i П -> O i h :: t -> f h; iter f t sau, cu o functie auxiliara care evita retransmiterea parametrului f: f = i П -> O i h :: t -> f h; iterl t iterl List iter print int List iter (Printf printf ) 1 2 3 - : unit = () : (’a -> bool) -> ’a list -> ’a list f [al; a2; ; an] : lista elementelor ak pentru care f ak e adevarata f = i [] -> [] i h :: t -> filtl = filtl t f h h :: ft ft List filter ( x -> x mod 3=0) ;; - : int list = List filter ( x -> x > 3) ;; - : int list = а = г b = fr2 П b П i h :: t -> h :: sieve (List filter ( г fr2 (b::r) (b-1) x -> x mod h <> 0) t) = sieve (fromto 2 10000) (’a -> ’b -> ’a) -> ’a -> ’b list -> ’a List fold left en] = f ( f (f rO el) e2 ) [ ei f rO [el; e2; 6n ] i [] -> a i h : : t foldl List fold left List fold left List fold left - : int = 4 0 + length a = foldl (f a h) t prelucreaza elementele de la cap, e tail-recursive (+) 0 ( s e -> s + String length e) 0 [ 1 1 + length = 3 3 + length = 4 : un , odata pentru fiecare element al listei calculeaza un (pentru fiecare element) are nevoie de 3 parametri: 1 o f cu 2 parametri de tip pl: rezultatul calculat pana acum de tip p2: elementul curent din lista de tip rezultatul f pl p2 devine pl in apelul cu urmatorul element 2 valoarea de tip (rezultatul pentru lista vida, si pl pentru primul apel al lui f) 3 de prelucrat de tip Un limbaj imperativ ar folosi o la fiecare iteratie in List fold left, rezultatul functiei fin fiecare iteratie e folosit de fin urmatoarea iteratie (ca prim parametru) Minimul unei liste i [] -> invalid arg i h :: t -> List fold left min h t list min -> ( m e -> min m e) 3 9 ( m e -> min m e) 3 (-2) ( m e -> min m e) (-2) 4 List fold left min 3 -> min 39=3 -> min 3 (-2) = -2 -> min (-2) 4 = -2 inversarea unei liste: capul listei ramase de inversat devine capul rezultatului acumulat = List fold left ( t h -> h :: t) [] ( t h -> h : : t) [] 3 -> 3 : : [] = ( t h -> h : : t) 7 -> 7 : : = ( t h -> h : : t) 5 -> 5 : : = exista ca functie standard pentru liste (’a -> ’b -> ’b) -> ’a list -> ’b -> ’b fold right f [el; e2; ; en] rn = f el (f e2 ( (f en rn fold right calculeaza, de la dreapta la stanga rezultatul = f el b i h :: t -> f h (foldf b t) foldf b ist fold right prelucreaza elementele de la coada, nu e tail-recursive Exercitiu: scrieti folosind partea mecanica de cea functionala (parcurgerea standard a listei de prelucrarea specifica problemei) Nu necesita scrierea (repetata) a codului de parcurgere intentia prelucrarii poate fi scrisa mai clar (mai direct) Reduce probabilitatea erorilor la sfarsitul prelucrarii (lista vida) in multe cazuri, aceasta parcurgere standard poate fi Aceste idei au fost preluate Java 8 introduce interfata Stream : are metode de iterare similare (map, filter, reduce) permite paralelizarea lor permite prelucrari cu functii anonime (lambda expressions) Listele sunt cel mai simplu tip exista in multe limbaje, vezi java util Collection Lucrul cu cum scriem simplu "fa operatia asta pe toata lista" Prelucrari care au ca parametri ne permit sa indicam prelucrarea dorita Lucrul cu liste prin potrivire de Recursivitate Citirea caracterelor Declararea variabilelor - recursiv, rezolvam o problema reducand-o la o problema mai simpla - adesea, e eficienta impartirea in doua probleme cat mai egale = strategie (divide and conquer) 10 martie 2009 xn = pow2(25, 3) - - evaluarea lui pow(x, n 2) se face care lucreaza cu obtinuta double sqr(double x) 2) unsigned fib(unsigned n) { printf("calculez fib(%d) n",n); return n b ? a : b; }  unsigned maxcifra(unsigned n) {    cifra maxima din numar return n k> == 65, JaJ == 97, etc 0 1 2 3 4 5 6 7 8 9 A В с D E F 0x0  0  a  b  t  n  v  f  r 0x10: 0x20: # s 7 & ( ) * + -   0x30: 0 1 2 3 4 5 6 7 8 9 7 0x40: @ A В c D E F G H i J К L M N □ 0x50: P 4 R s T U V W X Y Z [   ] - 0x60: avem ’7’ == + 7 ’5’ - ’0> == 5 ’E’ - JAJ == 4 ’f’ == 1 a’ + 5 ’ 0’ nuli ’ n’ linie noua Reprezentari pentru caractere speciale: }  a’ alarm ’ r’ carriage return ’ b’ backspace ’ f’ form feed ’ t ’ tab a postrof ’ v’ vertical tab ’W backslash Programarea calculatoarelor Curs 3 Marius Minea Recursivitate Citirea camct^'e ior Dec'ararea variabilelor Recursivitate Citirea caracterelor Declararea variabilelor 12 int getchar(void); ( in stdio h) : getcharO fara parametri, returneaza caracterul (codul ASCii) ca unsigned char convertit la int, sau returneaza valoarea EOF (-1, nu e unsigned char) daca nu s-a citit un caracter (la sfarsit de fisier, end-of-file) La tastatura, caracterele sunt introduse cu ecou, intr-un tampon, si pot fi preluate de program (ex getcharO doar dupa tastarea Enter ATENtiE! Programul nu are control asupra datelor introduse la citire =4" trebuie si tratate erorile int putchar(int c); ( in stdio h) ѲХ : putchar(’7’) - un unsigned char (dat ca si int); returneaza valoarea scrisa #include int main(void) -{ putchar(’A’); putchar(’:’);    scrie caracterul A apoi : putchar(getchar());    scrie un caracter citit return 0; Programarea calculatoarelor Curs 3 Marius Minea Folosim tot definitia recursiva a numarului, evidentiind ultima cifra Fie numarul cic2 cm, si secventele partiale ci, с-^с?, с^с^сз, Avem: r0 = 0, rk = 10   гк г t ck, (k > 0) Definim recursiv o functie care calculeaza numarul pornind de la rk 1 si cifra curenta c^: - cand caracterul citit nu mai e cifra, numarul e gata format in r - altfel, continuam recursiv de la 10-rtc, citind urmatorul caracter tinem cont ca getcharO returneaza codul ASCii, nu valoarea cifrei =4" ajustam cu -’0’, de ex 6 == ’6’ - ’0’ #include    pt functia isdigit (caract e cifra ?) #include    citeste nr nat cat timp vede cifre, r = val partii deja citite unsigned readnat rc(unsigned r, int c) f    c = urm caracter citit return isdigit(c) ? readnat rc (10*r + (c-’O’), getcharO) : r; Programarea calculatoarelor Curs 3 Marius Minea Recursivitate Citirea caracterelor Declararea variabilelor 13 Recursivitate Citirea caracterelor Declararea variabilelor Ca solutie finala, scriem o functie fara parametri auxiliari: int readnat(void) { return readnat rc (0, getcharO); }  Completam cu o functie care citeste un intreg, ce poate avea si semn: int readint c(int c) {    tine cont de semn; c: primul caracter return c == ? - readnatO : c == ’+’ ? readnatO : readnat rc (0, c); int readint (void) { return readint c (getchar ()); }     fara param, int main(void) { printf ("numarul citit este: %d n", readintO); return 0; Programarea calculatoarelor Curs 3 Marius Minea Un calcul pur nu are alte efecte: urmatorul program nu scrie nimic! int sqr(int x) { return x * x; }  int main(void) { return sqr(2); }  Apelul repetat al unei functii (in matematica, sau din cele scrise pana acum: sqr, fact, etc ) cu aceiasi parametri produce acelasi rezultat (repetitia poate fi ineficienta, dar rezultatul e acelasi, ex pow2, fib) in contrast, tiparirea (printf) produce un efect vizibil (si ireversibil) Citirea cu getcharO returneaza caracter din intrare la fiecare apel; caracterul e O modificare in starea mediului de executie a programului se numeste (ex citire, scriere, atribuire - v ulterior) Uneori e necesar sa memoram o valoare (caracter citit de la intrare, pentru a nu se pierde sau rezultat de functie, pentru a nu-l recalcula) Vom discuta cum se face aceasta prin unei Programarea calculatoarelor Curs 3 Marius Minea Recursivitate Citirea caracterelor Declararea variabilelor Recursivitate Citirea caracterelor Demararea variabilele La o problema (functie): ce se da (parametrii); ce se cere (rezultatul) Uneori, e nevoie de rezultate valori intermediare => Ex: citirea de numar: caracterul curent c nu e dat in enuntul problemei => e ceva ajutator, functia il poate citi singur Declaram o variabila: unsigned readnat r(unsigned r) { int c = getcharO;    declaram c, initializat cu caract citit return isdigit(c) ? readnat r(10*r + c - ’0’) : r; O e un obiect cu un nume si un tip Se foloseste la memorarea unor valori (altele decat parametrii de functie) necesare in calcule : una sau mai multe variabile de acelasi tip: double x; int a = 1, b, c; (a e initializat cu 1, restul nu) Declaram variabile cand e nevoie sa returnate de functii) pentru Programarea calculatoarelor Curs 3 (de exemplu Marius Minea Un program С e o colectie de functii => e scris modular1, fiecare functie rezolva o subproblema; programul principal main le apeleaza combina Numele parametrilor unor functii diferite nu se influenteaza; ca si in matematica putem avea  (x) = si g(x} = => la fel pentru variabilele declarate in functii ( ) al unui identificator (de ex variabila) = partea de program unde poate fi utilizat (intelesul sau e cunoscut) Parametrii si variabilele declarate in functii au domeniul de vizibilitate corpul functiei => nu sunt vizibile in exteriorul functiei Variabilele locale au automata: sunt create la fiecare apel al functiei si distruse la incheierea acestuia (intre apeluri nu exista si deci nuisi pastreaza valoarea) Corpul { } unei functii C contine o secventa de declaratii si instructiuni -in C99, declaratiile si instructiunile pot aparea in orice ordine -in standardele anterioare: intai declaratii, apoi instructiuni Programarea calculatoarelor Curs 3 Marius Minea Recursivitate Citirea caracterelor Declararea variabilelor 17 Recursivitate Citirea caracterelor Declararea variabilelor 18 Adaptam readnat: daca intalnim punct, citim partea fractionara #include #include double readfrac(double r, double plO) {    r: fractia acumulata int c = getcharO;    plO: puterea subunitara a zecimalei curente return isdigit(c) ? readfrac(r + (c-’0’)*pl0, 0 1*pl0) : r; double readreal r(double r) {    valoarea acumulata: reala int c = getchar(); return isdigit(c) ? readreal r(10*r + (c-’O’)) :    p intreaga c == ’? r + readfrac(0, 0 1) : r;    adauga p fractionara double readreal (void) { return readreal r (0); }  int main(void) { printf ("%f n" , readreal O); return 0; Programarea calculatoarelor Curs 3 Marius Minea Functie care inverseaza o linie de text si returneaza nr de caractere: inversarea recursiva unui sir: - daca sirul e vid, inversul e vid - altfel: punem primul element dupa inversul restului sirului => caracterul citit trebuie memorat pana inversam restul liniei #include unsigned revline(void) { int c = getchar(); unsigned len = ((c == ’ n’) ? 0 : 1 + revlineO); putchar(c); return len; int main(void) { printf (" nLinia a avut %u caractere n" , revlineO); return 0; Programarea calculatoarelor Curs 3 Marius Minea Tipuri Operatori Expresii 19 octombrie 2004 Un : determina multimea valorilor pe care le poate lua o variabila, si operatiile care pot fi efectuate - reprezentate pe un numar de octeti => set de valori (chiar daca in matematica, domeniile pentru intregi si reali sunt nelimitate) => Atentie la depasiri ii! Limbajul C are doar cateva tipuri de baza - char: caractere, reprezentate pe 1 octet (8 biti) - int: numere intregi - float: numere reale (virgula mobila), in precizie simpla - double: numere reale, in dubla precizie Domeniul de valori pentru intregi si reali e dependent de arhitectura (de obicei, corespunde natural cu dimensiunea registrilor procesorului) Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea Tipuri Operatori Exnresii Tipuri Operatori Expresii in memoria calculatorului, numerele se reprezinta in binar (baza 2) Valoarea unui , cu к cifre binare (biti): CA -VA-2 • • • cico (2) = ca—i * 2a 1 + • • • + "1 * 21 + c0 * 2° = bitul cel mai semnificativ (superior) cp = bitul cel mai putin semnificativ (inferior) Exemple: 11111111 == 255; cp = 0 => nr par; cp = 1 => nr impar intregi : reprezentate in complement de 2 daca bitul superior e 1, nr se considera negativ valoarea: translatata cu 2k in Jos fata de interpretarea fara semn lca 2 cicp (2) = -2a' 1 + ca 2 * 2a' 2 + + ci * 21 + cp * 2° Exemple (pe 8 biti): 11111111 == -1; 10000000 == -128 (float: semn, exponent, mantisa) S EEEEEEEE MMMMMMMMMMMMMMMMMMMMMMM (1+8+23 biti) pt 0 - int, short: > 2 octeti, minim [—215, 215 - 1] = [-32768, 32767] - long: > 4 octeti, acopera minim [-231 (-2147483648) , 231 - 1] - long long: > 8 octeti, acopera minim [-263, 263 - 1] - unsigned pastreaza dimensiunea; intre 0 si 2s ‘ - 1 (b = nr octeti) - sizeof(short) folositi sizeof pentru a scrie programe portabile Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea Tipuri Operatori Expresii Tipuri Operatori Expresii - in baza 10: scrise obisnuit; ex -5 -in baza 8: cu prefix cifra zero; ex 0177 (127 zecimal) - in baza 16: cu prefix 0x sau 0X; ex 0xA9 (169 zecimal) - sufix u sau U pentru unsigned, ex 65535u - sufix 1 sau l pentru long ex 0177777L - caractere tiparibile, intre ghilimele simple: ’0’, ’!’, ’a’ caractere speciale: * n* linie noua ’ 0’ nuli carriage return ’ b’ backspace apostrof (ghilimea) ’ t’ tab > v backslash - caractere scrise in octal (max 3 cifre), ex: ’ 14' - caractere scrise in hexazecimal (prefix x), ex ’ xff’ ASCii = American Standard Code for information interchange Caracterele sunt memorate ca si cod numeric = indicele in acest tabel ex ’0’ == 48, ’A’ = 65, ’a’ = 97, etc 0 1 2 3 4 5 6 7 8 9 A В с D E F 0x0  0  a  b  t  n  v  f  r 0x10: 0x20: i и # s 7 & } ( ) * + -   0x30: 0 1 2 3 4 5 6 7 8 9 ? 0x40: Q A В c D E F G H i J К L M N 0 0x50: P Q R s T U V W X Y Z [   ] 0x60: 0x7f (127): nu fac parte din setul ASCii (diacritice, etc - diverse variante standardizate de iSO) Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea Tipuri Operatori Expresii Tipuri Operatori Expresii Numerele reale: reprezentate cu semn, mantisa, si exponent => domeniul de valori e simetric fata de zero => precizia se defineste relativ la modulul numarului Exemple de dimensiuni (compilator gcc pe І386, sub Linux): - float: 4 octeti, intre cca iO-38 si iO38, 6 cifre semnificative - double: 8 octeti, intre cca iO-308 si iO308, 15 cifre semnificative - pentru precizie suplimentara: long double (12 octeti) : valori minime cerute de standard SHRT-MiN, iNT MiN -32767 LONG MiN -2147483647 USHRT MiN, UiNT MiN 65535 SHRT MAX, iNT MAX 32768 LONG MAX 2147483647 ULONG MAX 4294967295 Obs: pe gcc i386 Linux, int are aceleasi dimensiuni ca si long : valori pt gcc i386 Linux (si cerintele standard) - contin mantisa, iar optional semn si exponent (prefix e sau E) -in mantisa, partea reala sau zecimala poate lipsi, dar nu amandoua - implicit, orice constanta reala e considerata double - sufix f sau F pentru float; 1 sau l pentru long double Exemple: 1 0 sau 1 sau lei 3 14159265358979323846 1 175494e-38f FLT DiG 6 FLT MiN FLT MAX FLT EPSiLON DBL MiN DBL MAX DBL EPSiLON DBL DiG 15 (min 10)  * precizie zecimala *  1 17549435e-38F (max 1E-37) 3 40282347e+38F (min 1E+37) 1 19209290e-07F (max 1E-5)  * nr min cu 1+eps > 1 *  2 2250738585072014e-308 (max 1E-37) 1 7976931348623157e+308 (min 1E+37) 2 2204460492503131e-16 (max 1E-9) Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea Tipuri Operatori Expresii Tipuri Operatori Expresii 10 - int (chiar long): domeniu de valori mic (cca ± 2 miliarde) - e insuficient pentru multe calcule care implica aparent intregi Ex calculati e-1, = 1 - ar1 !! + ;v2 2! - cu o precizie data (iO-5) Daca se calculeaza factorialul ca intreg, va da depasire pt n > 12 mai bine: fara factorial, cu recurenta intre termeni: ln = ln i *x n - pana la 9E15 tipul double distinge inca doi intregi consecutivi - o valoare citita de la intrare nu e reprezentata neaparat precis! float x; scanf("7 f", tac); printf ("7 7f", x); 4 2 , 4 1999998 fractii exacte in baza 10 pot fi periodice in baza 2 1 2(10j = l (OOll)p) -in calcule matematice, adeseori comparatia == e insuficienta (pot apare pierderi de precizie pe parcurs) - mai bine: fabsCx - y) 1 Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea Operatorul sizeof returneaza numarul de octeti de memorie ocupati de un tip de date (sau o variabila sau constanta): #include void main (void) printf("char t t%d n",sizeof(char)); printf("short t t%d n",sizeof(short)); printf("int t t%d n",sizeof(int)); printf("long t t%d n",sizeof(long)); printf("float t t%d n",sizeof(float)); printf("double t t%d n",sizeof(double)); printf("long double t%d n",sizeof(long double)); Caracterul > t* (tab) sare la alinierea urmatoare (tipic: 8 caractere) Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea Tipuri Operatori Expresii 11 Tipuri Operatori Expresii 12 -operatorii uzuali binari: +, *,   pentru numere intregi si reale ATENTE: pentru intregi,   inseamna impartire cu rest - operatorul 7 (numai pentru intregi): modulo (restul la impartire) 9 -5==-l 97 -5==4 -9 5=-l -97 5=-4 -9 -5==l -97 -5=-4 (restul are semnul deimpartitului) - operatorul unar - (minus; nu exista plus unar) in expresii aritmetice, caracterele sunt considerate ca si intregi (indicele caracterului respectiv in tabela ASCii) Exemplu: ’7’ - ’0’ == 7, ’a’ + 5 == ’f’ (cifrele, respectiv literele ocupa spatiu continuu in tabela de caractere) Precedenta: - unar, apoi *,  , 7 , apoi +, - Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea - C nu are tip boolean; se foloseste int (C99: Tool, stdbool h) - operatorii logici produc 1 pt true, 0 pt false - un intreg e interpretat ca true daca e yt 0 si ca false daca e 0 : precedenta mai mica decat cei aritmetici x , >=, <> se poate scrie natural (x determina semnul caracterelor cu bitul 7 pe 1, si implicit semnul la conversia char -> int la conversia comparatia intre int si unsigned !! valorile > int max sunt considerate negative ca int => rezultate incorecte   surprinzatoare   neintuitive int i; unsigned u = 3000000000;  * u > iNT MaX *  i = u + 5;  * bitul de semn 1 => i e considerat negativ *  if Ci > u) printf ("7 d > 7,u n", i, u);  * tipareste: -1294967291 > 3000000000 !! ! *  Pentru a compara int i cu unsigned u - inlocuiti Ci u) cu Ci > 0 && i > u) Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea Tipuri Operatori Expresii Tipuri Operatori Expresii 16 : partea dreapta convertita la tipul partii stangi - e posibila trunchierea daca atribuim la un tip de dimensiune mai mica => mesaje de avertizare de la compilator Exemplu: int i; char c; i = с; c = i;  * valoarea se pastreaza *  c=i; i = c;  * bitii superiori se pierd *  partea dreapta e evaluata independent de tipul partii stangi! unsigned eur rol = 38400, usd rol = 32700; float eur usd; eur usd = eur rol   usd rol;  * 1 !! ! *  (engl type cast) Sintaxa: ( nume tip ) expresie expresia este convertita ca in atribuirea unei variabile de tipul dat eur usd = (double) eur rol   usd rol;  * 1 17 *  int n; sqrt ((double)n);  * double sqrt(double) in inath h *  Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea propriu-zisa: var = expr (un operator ca oricare altul) => o expresie de atribuire poate fi folosita in alta expresie compusa (si valoarea ei e chiar cea a expresiei atribuite) a = b = c  * asociativ la dreapta, a = (b = c) *  if (Ce = getcharO) != ’ n’) {  * folosim rezultatul in test *  } : Nu gresiti folosind atribuirea in loc de test de egalitate!! if (x = y) testeaza daca valoarea lui у (atribuita si lui x) e nenula : += -= *=  = • ,= x += expr e o forma mai scurta de a scrie x = x + expr vezi ulterior si pentru operatorii pe biti " " & * i prefix postfix: ++ — ++i incrementare cu 1, valoarea expresiei este cea de dupa atribuire i++ incrementare cu 1, valoarea expresiei este cea dinainte de atribuire int x=2, y, z; у = x++;  * y=2,x=3 * ; z = ++x;  * x=4,z=4 *  Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea Tipuri Operatori Expresii 17 Tipuri Operatori Expresii 18 - numara caracterele din sirul s in variabila i for Ci = 0; s[i] != ’ 0’; i++);  * sirul se termina cu ’ 0’ *  sau, cu un test implicit de valoare nonzero, si preincrement: for Ci = -1; s[++i]; );  * corpul lui for este vid *  - copiaza sirul src in sirul dest; expresia atribuita serveste si pt test for Ci = j =0; dest[j++] = src[i++]; ); - copiaza max N caractere; cand primul test e fals, se omite al doilea (deci nu se mai executa atribuirea) for Ci = j = 0; i o expresie care contine mai multi operatori cu efect lateral poate avea rezultat   efect nedeterminat Exemple eronate: int i = 0; printf ("7,d ’ ,d", i++, i++);  *0 1 sau 1 0 * ); (argumentele unei functii se pot evalua in orice ordine) while Cs[i] b) ? a : b;  * max(a, b) *  printf("Numarul este 7 s n", (n dimensiunea spatiului starilor limiteaza aplicabilitatea (daca o stare are іг biti, rezulta direct cate putem reprezenta in memorie) - tipic, limitat la cateva milioane de stari Daca spatiul starilor atinse e mic fata de spatiul potential complet, se poate incerca o codificare a starilor pe numar mai mic de biti ( , metoda folosita in SPiN) Metoda e insa doar o : daca se ajunge la o stare cu cod deja intalnit, explorarea se opreste (desi poate starea e diferita) => o parte din spatiul starilor poate ramane neexplorata Verificare formala Curs 3 Marius Minea Verificare formala Curs 3 Marius Minea Model checking simbolic Diagrame de decizie binare Model checking simbolic Diagrame de decizie binare Calculul starilor care pot fi atinse din starile initiale (EF true) - prin traversare a grafului pornind de la starile initiale - R: multimea starilor explorate; F: frontiera starilor atinse Cu R = 0; F = SQ while (F?= 0) choose s e F; F s7}  * * eventual F = F R * cu test F 0 *  іаі simplu daca se poate calcula a unei multimi de stari • O noua abordare: explorarea de stari - ideea: o multime poate fi uneori reprezentata (printr-o formula) intr-un spatiu mai mic decat explicit pentru fiecare stare in parte - reprezentare eficienta pt multimi de stari, relatie de tranzitie [McMillan’92] - cu ajutorul diagramelor de decizie binare (BDD) [Bryant’86] • idee cheie: Operarea cu multimi de stari - folosita si in cazul in care multimea starilor este infinita (sisteme in timp continuu, sisteme hibride) • idee cheie: prelucrarea iterativa pana cand nu se mai produc modificari = notiunea de = multimea R a starilor explorate creste la fiecare iteratie, dar e finita Verificare formala Curs 3 Marius Minea Verificare formala Curs 3 Marius Minea Model checking simbolic Diagrame de decizie binare Model checking simbolic Diagrame de decizie binare Def: x e D este pentru f : D -> D daca f(x) = x Def: O e o multime partial ordonata in care orice submultime finita are un cel mai mic majorant si un cel mai mare minorant Ex: multimea partilor P(S) a lui S, cu relatia de incluziune c - Lucram cu functii т : P(S) ->P(S) peste laticea P(S) - Privim S' c S ca un predicat peste S: S'(s) = true " s e S' in particular: 0 = false, S = true => t : P(S) ->- P(S) este o transformare de predicate Def: t este monoton daca P c Q => r(P) c -(Q) t este continuu la uniune daca pentru orice sir Pi с P2 c avem t(u,P,) = U,t(P,) t este continuu la intersectie daca pentru orice sir Pi D P2 D avem т(п,Р,) = П,т(Р,) Verificare formala Curs 3 Marius Minea O transformare de predicate monotona pe P(S) are intotdeauna - un punct fix minimal, notat pZ r(Z) - si un punct fix maximal, notat vZ r(Z) [Tarski] Daca S e finita si т e monotona, atunci т e continua la uniune si la intersectie T monotona  => r'tFalse) c Ti+1(False) si т‘(Тгиё) D ті+1(Тгие) Daca т e monotona si S e finita, exista i, j > 0 astfel ca Vfc > i, Tfc(False) = T’(False) si Vfc > j, тк(Тгие) = F(True) Daca t e monotona si S e finita, exista i, j > 0 astfel ca pZ r(Z) = t'(False) si vZ t(Z) = ті(Тгие) Verificare formala Curs 3 Marius Minea Model checking simbolic Diagrame de decizie binare 7 Model checking simbolic Diagrame de decizie binare identificam formula CTL f cu multimea de stari {s | M,s |=  } function Lfp(  : Trans) : Pred Q := False; Q'  = r(Q); while (Qz Q) do Q  = Q'-, Q'   = t{Q); return Q; function Gfp(r : Trans) : Pred Q := True; Q'-=-r( Q); while (Qz ф Q) do Q  = e dificil de testat: - echivalenta (dupa transformari in proiectarea circuitelor) - satisfiabilitatea: Sa-i,     -xn  (ari       arn) = 1 ? Va-  і(а-) =  2(a-) = ^3a-  i(a-)    2(a-) = 1 • noduri terminale: valoarea functiei (0 sau 1) • noduri neterminale: variabile • ramuri: low(v) (stanga)   high(v) (dreapta): atribuire 0 1 pt variabila din nod BDD-uri: obtinute prin 3 reguli de reducere Verificare formala Curs 3 Marius Minea Verificare formala Curs 3 Marius Minea Model checking simbolic Diagrame de decizie binare 13 Model checking simbolic Diagrame de decizie binare 14 ^2  (ni) = f( ni) => comaseaza nj si >12 Verificare formala Curs 3 Verificare formala Curs 3 Model checking simbolic Diagrame de decizie binare 15 Model checking simbolic Diagrame de decizie binare Marius Minea 16 Zow(n) = high(n) => elimina testarea lui n Verificare formala Curs 3 Marius Minea Cele 3 reguli se pot aplica indiferent de ordonarea variabilelor Pentru a defini o BDD ordonata (Ordered BDD = OBDD) se impune o conditie esentiala: Pe toate caile de la varf la nodurile terminale, variabilele apar in (= exista o ordonare globala a variabilelor) Teorema: Pentru orice functie, reprezentarea ca BDD ordonata, redusa cf regulilor 1-3 e pana la un izomorfism => reprezentare canonica => testare de echivalenta sau satisfiabilitate in 0(1) Obs: Un subgraf cu radacina intr-un nod de BDD este tot o BDD Verificare formala Curs 3 Marius Minea Model checking simbolic Diagrame de decizie binare Model checking simbolic Diagrame de decizie binare 18 Functia: (ai л 61) v (аг л 62) v (03 л 63) Crestere liniara: 2(n+l) Crestere exponentiala: 2"+1 function Apply(f g : OBDD, op : Operator) : OBDD if isJeaf(f) л is ieaf(g) return op(f,g); elsif (f,g, op, h) in apply cache return h; else x := topvar(f)  * variabila din varful lui f *  у := topvar(g) if (ord(x) = ord(y))  * x = у = aceeasi variabila *  h := find bdd(x,Apply(f   -c=0,g  x=0,op),Apply(f Ь=1 ор))  * find bdd creeaza un nou BDD daca nu exista deja *  elslf (ord(x) ) • Compose (Л | 4=fe) • Satisfy-one (un x cu f(x) = 1) • Satisfy-count (|{5= |  (5=) = 1}|) Factorii logaritmici pot fi eliminati (prin algoritmi mai sofisticati sau hashing) Verificare formala Curs 3 Marius Minea O(|G|   log |G|) O(|Gi|-|G2|) O(|G|   log |G|) O(|G1i2-|G2|) O(n) O(|G|) Produsul relational poate avea complexitate exponentiala Verificare formala Curs 3 Marius Minea Model checking simbolic Diagrame de decizie binare 21 Model checking simbolic Diagrame de decizie binare Exista implementari mature de biblioteci (pachete) de BDD-uri intr-o aplicatie tipica, multe BDD-uri au subgrafuri comune => pointeri intr-un unic graf multi-radacina Gestiunea memoriei: cu contor de referinta si garbage-collection Un vast numar de optimizari si euristici: - metode de dispunere si traversare pt caching avantajos - calcul paralel si distribuit, etc • Ordonarea variabilelor - efect critic asupra dimensiunii • Exista functii cu reprezentari exponentiale indiferent de ordonare (ex bitul mijlociul al unui multiplicator [Bryant’91]) • BDD-urile evolueaza in timpul executiei aplicatiei => f importanta reordonarea dinamica - efectuata transparent pentru algoritmii de verificare - reordonarea nivelelor adiacente nu modifica pointerii externi foo foi fio fu foo foi fio fll Verificare formala Curs 3 Verificare formala Curs 3 Marius Minea Model checking simbolic Diagrame de decizie binare Model checking simbolic Diagrame de decizie binare Relaxarea conditiei de ordonare: FreeBDDs - variabilele apar in orice ordine, fiecare doar o data - V atribuire la v, aceeasi ordine in toate functiile - reprezentari bune pt unele functii cu OBDD-uri exponentiale Alegerea relatiei de decompozitie functionala pentru OBDD: descompunerea Boole-Shannon: f = x л fsv x л fx fx = f l 2=o : cofactorul negativ fx = f l 2=i : cofactorul pozitiv Alte relatii de decompozitie: - f = h,   x л fsx descompunere Reed-Muller - f = fx   x л fS1 descompunere Davio pozitiva unde fSx = fx Ѳ k Multiterminal BDDs: extensie cu noduri terminale arbitrare (intregi, etc ) Verificare formala Curs 3 Marius Minea Exemplu: codificare numerica pe 3 biti: f = xq+ 2 * xi + 4* x? *4 *2 Edge-Valued BDD (EVBDD) ponderi multiplicative pe muchii Binary Moment Diagram (BMD) f=fx + v(fx-fx) Hybrid Decision Diagrams = BDD + BMD + MTBDD Verificare formala Curs 3 Marius Minea Model checking simbolic Diagrame de decizie binare Model checking simbolic Diagrame de decizie binare Cazul tipic: demonstrarea corespondentei dintre: - o descriere matematica (numerica) Fnum (ex operatia de inmultire) - un circuit fi,it cu operanzi in reprezentare binara Fie Num nr' r Z (sau R) functia care descrie semnificatia numerica a unui numar reprezentat binar Trebuie verificat: Num(fbit(xi,T2)) = Fnum( Num(xi), Num( 2)) => reprezentare eficienta pentru functii pe biti cat si numerice => se utilizeaza EVBDD, BMD, HDD, etc Principala aplicatie: in CAD si verificare formala in general: pentru reprezentarea compacta a datelor cu o anumita regularitate structura comuna, dificil de exprimat analitic • teoria codurilor • structuri mari de date, indexare • biologie computationala Exemplu: sistem de filtrare publish-subscribe in timp real - flux mare de mesaje; sute de mii de criterii de filtrare - criteriile de filtrare reprezentate ca structura de BDD-uri (propozitii atomice: atribut {relatie) valoare) - mesajele noi sunt filtrate prin algoritmi de evaluare a BDD-urilor - subcriteriile comune din BDD: evaluate o singura data Verificare formala Curs 3 Marius Minea Verificare formala Curs 3 Marius Minea Model checking simbolic Diagrame de decizie binare 27 Model checking simbolic Diagrame de decizie binare Ken McMilian (СМИ, 1987): ideea de a reprezenta sisteme in mod simbolic cu BDD-uri => [Burch, Clarke, Dill, McMilian, Hwang: Symbolic model checking: iO20 states and beyond, 1990] => verificatorul SMV; teza de doctorat: Symbolic Model Checking: An Approach to the State Explosion Problem (CMU, 1992) independent: - Coudert, Berthet, Madre - Pixley [Motorola, 1990] Reprezentare: codificare binara pentru stari si propozitii atomice => BDD-uri pentru multimi de stari, relatie de tranzitie Check(p) = {s e S | p 6 L(s)} bddJf then else(p, 1,0) Check(^f) = S   Check(f) bdd not Check(J kg) = Check(f) n Check(g) bdd and ChecktEX f) = CheckEX(Check(J)) CheckEX( f(-) ) = 37 [ (7) л R(v, 7)] RelPr'odl f R, v') CheckiE [f U i- 1 pasi din Succ(si) => alegem S2 6 Succ(si) n Q, i se atinge si+1 e EG fn Pk - eliminam Pk, continuam din si+1 pana vizitam si ultimul Pj (in sz) - daca sz |= EXE[ U"i], inchidem ciclul spre si => avem martorul - daca nu, sz e in alta SCC decat si- Repetam procedeul din sz - graful SCC-urilor e aciclic => procedeul e finit Verificare formala Curs 3 Marius Minea interpretare abstracta 11 mai 2004 O metoda pentru definirea unei a unui program, care poate fi utilizata pentru a analiza programul si a produce informatii despre comportamentul sau in executie [Cousot & Cousot ’77] inspirata din: - analiza fluxului de date sistematizeaza notiunile de proprietati analizate si caracteristicile fundamentale ale metodelor de analiza - semantica denotationaia formalizeaza notiunea de a semanticii unui program (corectitudinea e nedecidabila =s- avem nevoie de aproximare) Analiza programelor Curs 3 Marius Minea Analiza programelor Curs 3 Marius Minea interpretare abstracta 3 interpretare abstracta Consideram un limbaj care contine doar intregi si inmultire: e ::= i | e*e Definim semantica printr-o functie care da valoarea unei expresii:  1 : Exp —int, pli) — i, * 02) —  r(ej) * м(г’2) Definim o functie de abstractie a : E-i-pr {-,0,+} : {- daca i 0 - - 0 + si pentru expresii prin tabelul: + 0 - 0 0 0 + - 0 + La fel se poate introduce operatorul minus unar: i - 0 + -1+ o - introducem operatia de adunare => abstractia nu mai e precisa + - 0 + — - - T 0 - 0 + + T + + Apar valori care nu pot fi determinate precis (se pierde precizia) => e necesara introducerea lui T — {-,0,+} => apare din nou notiunea de Analiza programelor Curs 3 Marius Minea Analiza programelor Curs 3 Marius Minea interpretare abstracta 5 interpretare abstracta Similar, la introducerea operatorului de impartire  : nu putem imparti la zero o + T si extindem toate operatiile si - 0 + T + -L - T 0 ± 0 0 — -L + T T ± T T la ±: ± op x = x op ± = ± unui program: un model matematic (formal) al tuturor comportamentelor posibile ale unui sistem de calcul care executa acel program, in interactiune cu orice mediu posibil [cousot] Semantica unui limbaj de programare: defineste semantica oricarui program Abordare generala: semantica unui program poate fi definita ca solutie a unei (corespunzatoare iteratiei) => toate semanticile unui program pot fi organizate intr-o ierarhie, dupa nivelul lor de L Analiza programelor Curs 3 Marius Minea Analiza programelor Curs 3 Marius Minea interpretare abstracta interpretare abstracta - secvente de executie (finite sau infinite): descriu in fiecare punct valoarea variabilelor din program - semantica operationala: descrie comportamentul la nivel de stari si tranzitii (ca si automat) - semantica denotationala: descrie rezultatul executiei (inel, neter-minare) - semantica naturala: ca mai sus, ignora aspectul neterminarii - abstractia semn - abstractia pe intervale - abstractia poliedrala (infasuratoarea convexa a valorilor) - abstractia ortogonala (ecuatii de forma ±x (O si Va E А а = ri(7(a)) (abstractizarea urmata de concretizare introduce aproximare; concretizarea urmata de abstractizare e exacta) Aceasta e proprietatea fundamentala care exprima corectitudinea abstractiei ( ): ea poate genera valori suplimentare, dar niciodata nu va omite valori > e o abstractie conservatoare Fiind data o functie (transformare) in programul f : D -"  D in programul concret, ce corespondent are aceasta in programul abstract ? Raspuns: f t — а o f o 7 Pentru un element abstract x p A: - producem intai multimea de valori concrete 7(0-) - aplicam functia concreta f fiecarei valori, obsinand o multime de valori (concrete) - abstractizam multimea de valori concrete intr-o valoare abstracta (cu obisnuita posibila pierdere de precizie) Analiza programelor Curs 3 Marius Minea Analiza programelor Curs 3 Marius Minea interpretare abstracta 11 interpretare abstracta 12 Semantica unui program e data in general de o ecuatie de punct fix (datorata ciclurilor din program) - am vazut deja ecuatii de punct fix pentru analiza de flux de date Avem: - punctul fix al functiei f in domeniul concret - punctul fix al functiei ft in domeniul abstract - concretizarea punctului fix al lui ft Atunci, ifpf C 7(lfpft) Problema: daca lantul ascendent in calculul de punct fix are lungime infinita (laticea e de inaltime infinita in raport cu functia transformarea data), nu se poate determina un punct fix intr-un numar finit de pasi while (x >= 0) x = x + 1; Ex analiza codului de mai sus chiar cu intervale Pe de alta parte, "ghicind" intervalul [0,oo) e clar ca acesta e punct fix (si punctul fix minimal) Analiza programelor Curs 3 Marius Minea Analiza programelor Curs 3 Marius Minea interpretare abstracta 13 Permite eliminarea lanturilor de lungime infinita la calculul de punct fix, Гп doi pasi: - la inceput, o aproximare mai grosiera a lantului ascendent, care conduce la convergena mai rapida (in numar finit de pasi) - apoi, o revenire la precizie mai buna, printr-un lant de aproximari descendente, spre punctul fix propriu-zis Analiza programelor Curs 3 Marius Minea Programarea calculatoarelor Recursivitate Citirea caracterelor - recursiv, rezolvam o problema reducand-o la o problema mai simpla - adesea, e eficienta impartirea in doua probleme cat mai egale = strategie divide et impera (divide and conguer) double sqr(double x) { return x*x; } Marius Minea 11 martie 2008 ( 1 n •n = J (ж" 2)2 " | x • (ж"72)2 n - numarul de apeluri double pow2(double x, unsigned n) { = 0 return n == 0 ? 1 : n % 2 == 0 ? sqr(pow2(x, n 2)) impar x * sqr(pow2(x, n 2)); } necesar e 1 + (Іодзп) (exponentul se injumatateste la fiecare apel recursiv) de ex : pow2(5, 6) —r pow2(25, 3) —r pow2(625, 1) —r pow2(625, 0) - evaluarea lui pow(x, n 2) se face o singura data ca argument pt sqr care lucreaza cu valoarea obtinuta (nu substituie expresia de doua ori) Programarea calculatoarelor Curs 3 Marius Minea Programarea calculatoarelor Curs 3 Marius Minea Programarea calculatoarelor Recursivitate Citirea caracterelor Programarea calculatoarelor Recursivitate Citirea caracterelor - daca inlocuim direct ж" 2 • ж" 2 щ locul functiei sqr si tiparim exponentul pentru a urmari desfasurarea apelurilor recursive: obtinem pentru exponent n = 3: double pow2(double x, unsigned n) { printf("exponent %u n", n) ; return n == 0 ? 1 : n % 2 == 0 ? pow2(x, n 2) * pow2(x, n 2) : x * pow2(x, n 2) * pow2(x, n 2); 1 exponent 3 exponent 1 exponent 0 exponent 0 exponent 1 exponent 0 exponent 0 - dar, putem rescrie definitia chiar mai simplu: [ 1 ж" = i (ж2)п 2 i ж • (ж2)" 2 п = 0 п par п impar double pow2(double x, unsigned n) { return n == 0 ? 1 : n % 2 == 0 ? pow2(x*x, n 2) : x * pow2(x*x, n 2); (similar cu prima varianta, dar nu mai e nevoie de sqr) - cele doua expresii pow(x, n 2) se evalueaza succesiv, independent! tara optimizari, compilatorul nu cauta expresii egale, si recalculeaza - nr de apeluri e mai mare decat la inmultirea oPisnuita x - - x => Atentie la repetarea ineficienta a rezolvarii acelorasi suPproPleme => uneori o schimbare minora in solutie foarte diferita Programarea calculatoarelor Curs 3 Marius Minea Programarea calculatoarelor Curs 3 formularea problemei conduce la o Marius Minea Programarea calculatoarele* 1' Recursiv'tate C'tire? caracterelor Programarea calculatoarelor Recursivitate Citirea caracterelor Fo — Fl — 1 • Fn — Fn i + F" 2 (n > 2) unsigned fib(unsigned n) { printf("calculez fib(%d) n",n); return n multe brobleme au aceasta structura secventiala Exemblu: un numar natural in baza 10 are fie o singura cifra, fie e format din ultima cifra, precedata de alt numar in baza 10 descompunere cu relatia: n = 10(n  10)+n %10, ex 1457 = 10 145+7 unsigned nrcifre(unsigned n) { return n b ? a : b; } unsigned maxeifra(unsigned n) { return n 7 0x40: : © A В c D E F G H i J К L M N 0 0x50: : P Q R s T U V W X Y Z [   ] 0x60: a b c d e f g h i j к 1 m n 0 0x70: : P q r s t u V w X У z { } Am scris 0x7f (127): nu fac parte din setul ASCii (diacritice, etc - diverse variante standardizate de iSO) Programarea calculatoarelor Curs 3 Marius Minea Programarea calculatoarelor Recursivitate Citirea caracterelor Programarea calculatoarelor Recursivitate Citirea caracterelor Tipul standard char reprezinta caractere (codul lor ASCii - un intreg) =4> in C, tipul char e un tip intreg, dar cu domeniu de valori mai restrans decat int sau unsigned =t> poate fi memorat pe (8 ) Cf standardului, char poate fi signed char, cu valori de la -128 la 127, sau unsigned char, cu valori de la o la 255 Ambele sunt incluse in int in program, se scriu intre apostroafe (simple) ’ Au valori intregi: codul ASCii in calcul se convertesc automat la int Cifrele, literele mici si literele mari sunt dispuse consecutiv =t> avem ’7> == >o> + 7 ’5> Reprezentari pentru caractere speciale: - >o> == 5 ’E’ - >A> ’ o> nuli ’ a’ alarm ’ b’ backspace ’ t’ tab ’ v’ vertical tab Programarea calculatoarelor Curs 3 == 4 >f> == >a> + 5 ’ n’ linie noua ’ r’ carriage return ’  f ’ form feed ’ " apostrof ’W’ backslash Marius Minea int getchar(void) declarata in stdio h - functie fara parametri, returneaza valoarea caracterului (codul ASCii) ca si unsigned char convertit la int -sau returneaza valoarea speciala EOF (end-of-file) (-1, diferita de orice unsigned char daca nu s-a putut citi un caracter (la sfarsit de fisier) La tastatura, caracterele sunt introduse cu ecou, si devin disponibile pentru citire din program doar dupa ce se tasteaza Enter ATENtiE! Programul nu are control asupra datelor introduse la citire =i trebuie verificat intotdeauna ce s-a citit   testate erorile int putchar(int c) - scrie un unsigned char dat ca si int; returneaza valoarea scrisa #include int main(void) { putchar!’:’);    scrie caracterul : putchar(getcharO);    citeste si scrie un caracter return 0; } Programarea calculatoarelor Curs 3 Marius Minea Programarea calculatoarelor Recursivitate Citirea caracterelor Programarea calculatoarelor Recursivitate Citirea caracterelor 12 #include    pt functia isdigit (caract e cifra ?) #include    citeste nr natural, pana la primul caracter diferit de cifra unsigned readnat rc(unsigned r, int c) {    r: rezultatul partial acumulat; c: urmatorul caracter citit return isdigit(c) ? readnat rc(10*r + (c-’0’)> getcharO) : r; 1 int readnat(void) { return readnat rc(0, getcharO); 1 int readint c(int c) {    tine cont de semn; c: primul caracter return c == ’? - readnat() : c == ? readnatO : readnat rc(0, c) ; 1 int readint(void) { return readint c(getchar()); }    fara param, int main(void) { printf("numarul citit este: %d n", readint()); return 0; 1 Programarea calculatoarelor Curs 3 Marius Minea Un calcul pur nu are alte efecte: urmatorul program nu scrie nimic! int sqr(int x) { return x * x; } int main(void) { sqr(2); } Apelul repetat al unei functii (in matematica, sau din cele scrise pana acum: sqr, fact, etc ) cu aceiasi parametri produce acelasi rezultat (repetitia poate fi ineficienta, dar rezultatul e acelasi, ex pow2, fib) in contrast, tiparirea (printf) produce un efect vizibil (si ireversibil) Citirea cu getcharO returneaza alt caracter din intrare la fiecare apel; caracterul e consumat O modificare in starea mediului de executie a programului se numeste (ex citire, scriere, atribuire - v ulterior) Uneori e necesar sa memoram o valoare (caracter citit de la intrare, pentru a nu se pierde sau rezultat de functie, pentru a nu-l recalcula) Vom discuta cum se face aceasta prin la o Programarea calculatoarelor Curs 3 Marius Minea Declaratii instructiuni 18 octombrie 2004 Programarea calculatoarelor 2 Curs 3 Marius Minea Declaratii instructiuni Un program C: compus din > 1 unitati de compilare (fisiere) Fiecare: un sir de declaratii (de tipuri, variabile, functii) sau definitii de functii translation-unit ::= external-declaration | translation-unit external-declaration external-definltlon ::= declaratlon | functlon-definltlon O specifica interpretarea si atributele unui - pentru o variabila, numele si tipul - pentru o functie, numele, tipul, si tipul parametrilor O e o declaratie care specifica complet identificatorul respectiv - pentru o variabila, in plus, are ca efect alocarea memoriei - pentru o functie, include corpul functiei Un identificator nu poate fi folosit inainte de a fi declarat - e necesara o declaratie, daca obiectul e folosit inainte de definitie ex printf e declarata in stdio h si definita intr-o biblioteca standard Programarea calculatoarelor 2 Curs 3 Marius Minea 3 Declaratii instructiuni Forma generala: lista de obiecte cu acelasi tip de baza, evtl initializate: int i = 1, n, tab , f(double, int); Sintaxa cu tipul de baza in fata e similara cu folosirea in expresii: tab[ceva] este un int f(ceval, ceva2) este un int declaratie ::= specificatori Opt tip lista-declaratori-init ; lista-declaratori-init ::= declarator-init | lista-declaratori-init , declarator-init declarator-init ::= declarator | declarator = initializator declarator ::= identificator | declarator [ expresie ] pt tablouri | declarator ( parametri ) pt functii | * declarator pt pointeri Specificatori: extern, static, const, typedef, inline etc Programarea calculatoarelor 2 Curs 3 Marius Minea Pt orice identificator, compilatorul trebuie sa-i decida semnificatia identificatorii obisnuiti' variabile, tipuri, functii, constante enumerare au un comun (NU: variabila si functie cu acelasi nume) Ql: Un identificator poate fi folosit intr-un punct de program ? R: (al unei declaratii   al unui identificator) - domeniu de vizibilitate la nivel de (ff e scope) pentru identificatori declarati in afara oricarui bloc (oricarei functii) din punctul de declaratie pana la sfarsitul fisierului compilat - domeniu de vizibilitate la nivel de (block scope) pentru identificatori declarati intr-un bloc { } (corp de functie, instructiune compusa) si pentru parametrii unei functii din punctul de declaratie pana la acolada } care inchide blocul Un identificator poate fi intr-un bloc interior si isi recapata vechea semnificatie cand blocul ia sfarsit Programarea calculatoarelor 2 Curs 3 Marius Minea Declaratii instructiuni Declaratii instructiuni int m, n, p; float x, y, z; void f(int n, int x) { int 1; float у = 1; m = p; p = n; for (1 = 0; i 1 ori intr-un bloc O declaratie a unui identificator pt un obiect e o - daca declaratia la nivel de fisier, cu un initializator - daca declaratia e la nivel de bloc, fara legaturi (vezi mai sus) O declaratie de obiect la nivel de fisier, fara initializare, si fara specificator de memorare, sau cu specificatorul static e o Daca un identificator are in fisier una sau mai multe definitii tentative, dar nici o definitie externa, se comporta ca si pentru o definitie externa la nivel de fisier, cu initializator nul Programarea calculatoarelor 2 Curs 3 Marius Minea int x; extern int у, z; static int m; int y; extern int m; void f(int x); static int g(double); int h(int); void f(int m); extern int h(int y); void f(int x) -( z=x; } void main(void) static int m; int x; { extern int x; } Programarea calculatoarelor 2 Curs 3 Declaratii instructiuni 9 Declaratii instructiuni  * xl, def tentativa, linkage extern *   * yl, zl, declaratie, linkage extern *   * ml, def tentativa, linkage intern *   * yl, def tentativa, vezi у mai sus *   * deci link intern, vezi m mai sus *   * declaratie functie, linkage extern *   * declaratie functie, linkage intern *   * declaratie functie, linkage extern *   * deci link extern, vezi f mai sus *   * deci link extern, vezi h mai sus *   * definitia functiei f; zl = x2; *   * definitia functiei main *   * m2, definitie, no linkage *   * x3, definitie, no linkage *   * declaratie, linkage extern, xl sus *   * g, h, z au definitii in alt fisier *  Marius Minea 10 Q3: Ce timp de viata durata de memorare are un obiect in program? R: 3 feluri diferite: static, automatic si alocat (discutat ulterior) Pe intreaga durata de viata, un obiect are o adresS constantS si Tsi pastreaza ultima valoare memorata Durata de memorare : pentru obiecte declarate cu tipul de legatura extern sau intern, sau declarate cu specificatorul de memorare static - timp de viata: intreaga executie a programului - obiectul e , inainte de lansarea in executie Durata de memorare : pentru obiecte fara legatura - timp de viata: de la intrarea in blocul asociat pana la incheierea sa - la fiecare apel recursiv, se creaza o noua instanta a obiectului - o eventuala initializare in declaratie e repetata de cate ori e atinsa Programarea calculatoarelor 2 Curs 3 Marius Minea Exemple: char sir [51; Sintaxa: specificatoriOpt tip ident [ Dl 1 [ Dn 1 initializareOpt declara un tablou n-dimensional de Dl x x Dn elemente de tip de fapt: tablou de Dl elem care sunt tablouri de Dn elem de tip : in C, numerotarea elementelor in tablou incepe de la zero! in ANSi C, tablourile se declara doar cu dimensiuni (pozitive) in C99, tablourile declarate local pot avea dimensiuni evaluate la rulare void f(int n) { char s[n + 31;  * prelucreaza s *  } Un tablou fara dimensiune data, neinitializat (int a[];) are 1 element! : caz particular de tablouri de char -in memorie, sfarsitul unui sir e indicat de caracterul special ’ 0’ (nul) : toate functiile care lucreaza cu siruri depind de acest lucru ! (dar conventia nu are legatura cu aspectul in text, de ex la citire) - constante sir: cu ghilimele duble ("test"), terminate implicit cu ’ 0’ Programarea calculatoarelor 2 Curs 3 Marius Minea Declaratii instructiuni 11 Declaratii instructiuni 12 - variabilele cu durata de memorare statica sunt initializate inainte de executie: implicit cu zero; explicit pot fi initializate doar cu constante - variabilele cu durata automata pot fi initializate cu expresii arbitrare (ori de cate ori initializarea e atinsa la rulare) Pentru variabilele de tip tablou, initializatorii se scriu intre acolade - nivelele de acolade indica sub-obiectele initializate int m = { { 1, 0, 0 }, { 0, 1, 0 } }; - daca nu, initializatorii se folosesc pe rand, in ordinea indicilor int c = { { 1, 1, 1 }, { { 1, 0 }, 1 } }; - pt initializator mai mic ca dimensiunea, restul nu e initializat explicit (v c , c ); cand e mai mare, restul se ignora char msg = "test"; ca si char msg = -{ ’t’,’e’,’s’,’t’ }; - daca dimensiunea nu e data explicit, se deduce din initializator char msg[] = "test"; ca si char msg = { }; - cand se specifica elementul de initializat, se continua apoi in ordine: int t = { 1, 2, 3, =2, 1 };  * t -t [Z] nespecificate *  Programarea calculatoarelor 2 Curs 3 Marius Minea Declaratia: prototipul (antetul) functiei: tip, nume, tipul parametrilor declaratle-functle ::= antet-functle ; decl-fct ::= speclficatorlOpt tip ident ( param-type-llst ) param-type-llst ::= param-llst | param-llst , param-llst ::= param-decl | param-llst , param-decl param-decl ::= specificatoriOpt tip | specificatoriOpt tip declarator int absCint n); int getchar(void); double powCdouble, double); - tipul returnat nu poate fi tablou; poate fi void (nimic) - numele parametrilor nu e relevant in declaratie si poate lipsi - o functie poate fi declarata repetat, cu declaratii compatibile - numar variabil de parametri daca lista se termina in (v ulterior) - declaratia doar cu O nu specifica parametrii si e perimata - specificatorul e o indicatie de optimizare pentru viteza; se rezuma la fisierul curent; depinde de implementare (vezi standard) Programarea calculatoarelor 2 Curs 3 Marius Minea Declaratii instructiuni 13 Declaratii instructiuni Sintaxa: definitie-functie ::= antet-functie bloc - blocul contine declaratii si instructiuni (corpul functiei) - parametrii specificati si prin nume (vizibilitate in corpul functiei) in C se face - expresiile date ca argumente in apelul de functie sunt evaluate si atribuite parametrilor formali (cu eventuale conversii ca la atribuire) - ordinea de evaluarea a argumentelor nu e specificata - dispunerea in memorie a argumentelor (pe stiva) nu e specificata - se executa corpul functiei; se revine la instructiunea de dupa apel Programarea calculatoarelor 2 Curs 3 Marius Minea O functie nu poate returna o valoare de tip tablou Pentru un tablou declarat tip t[Dl] [Dn]; compilatorul trebuie sa calculeze pozitia unui element t[il] [in] fata de inceputul tabloului Numarul de elemente dinaintea acestuia este: "i     • • •   Dn + "2   D3     Dn + + fn-i   Dn + in trebuie cunoscute dimensiunile D2 Dn, dar nu si Dl in ANSi C, o functie trebuie sa precizeze ca si constante dimensiunile parametrilor tablou (in afara de prima): void addmatCint a[] , int b[] );  * nu merge pentru c[] *  => e greu de scris functii flexibile (ex inmultirea de matrici oarecare) in C99, se pot specifica parametri tablou de dimensiuni variabile: void addmatCint m, int n, int a[m][n], int b[m][n]); Programarea calculatoarelor 2 Curs 3 Marius Minea Declaratii instructiuni 15 Declaratii instructiuni 16 engl storage class specifier; se indica cel mult unul pe declaratie , : discutati mai sus - stabilesc atat proprietatile de linkage cat si durata de memorare : implicit pentru variabile declarate la nivel de bloc : indicatie catre compilator de a optimiza pentru viteza accesul la o variabila (alocand pentru ea un registru daca e posibil) - nu se poate folosi operatorul adresa pentru variabile register : declaratie typedef unsigned long size t; typedef unsigned char byte; - daca in declaratie, identificatorul ar fi o variabila de un anumit tip, atunci typedef declaratie defineste identificatorul ca numele acelui tip Ex: in int mat3x5 ; mat3x5 ar fi o matrice de 3x5 intregi, typedef int mat3x5 :  * mat3x5 e tipul tablou de 3x5 int *  mat3x5 a, В;  * a, В sunt variabile tablou de 3x5 int *  Programarea calculatoarelor 2 Curs 3 Marius Minea specifica interzicerea modificarii prin program a valorii obiectului ex pt declaratii de constante: const int max = 100; - nu se permite folosirea de operatori de atribuire pt obiecte const - compilatorul e liber sa le aloce in memorie read-only - obiectul poate fi modificat in mod necunoscut implementarii (ex port hardware, intrerupere asincrona, program concurent) => indicatie catre compilator sa citeasca valoarea curenta din memorie la fiecare folosire, fara optimizari (cf register) - combinat cu const: obiectul poate fi modificat doar extern: extern const volatile int real time clock; - stabileste ca un obiect poate fi modificat doar prin pointerul indicat (calificator folosit doar cu pointeri, permite optimizari de compilare) Programarea calculatoarelor 2 Curs 3 Marius Minea Declaratii instructiuni 17 Declaratii instructiuni instructiunea expresieopt ; - orice expresie, evaluata pentru efectele ei laterale; in particular: expresii de : x = у + 1; у *= 2; —г; (ignorand valoarea returnata): printf ("salut ! n"); instructiunea ; (expresia lipseste) Exemplu: ciclu cu corp vid while (s[i++]); Obs: in C nu e separator, ci face parte din anumite instructiuni instructiunea (bloc) { lista-declaratii lista-instructiuni } grupeaza declaratiile instructiunile din lista sintacticintr-o instructiune poate fi incuibata (contine alte blocuri); poate fi vida { } lista-declaratii nu poate contine definitii de functii in C99 (sl in C++) un bloc poate contine declaratii si instructiuni in orice ordine Programarea calculatoarelor 2 Curs 3 Marius Minea identificator : instructiune expresie-constanta-int : instructiune instructiune Etichetele au spatiu de nume separat de cel al identificatorilor obisnuiti (putem avea variabile functii etc si etichete cu acelasi nume) Domeniul de vizibilitate al etichetei e corpul functiei in care se afla (numele de etichete trebuie sa fie unice in cadrul unei functii) Etichetele case si default pot apare doarin instructiunea switch intr-o instructiune switch poate exista cel mult o eticheta default iar constantele intregi din etichetele case vor fi distincte Programarea calculatoarelor 2 Curs 3 Marius Minea Declaratii instructiuni 19 Declaratii instructiuni instructiunea if ( expresie ) instructiunel sau if ( expresie ) instructiunel else instructiune2 - expresia trebuie sa fie de tip scalar (intreg, real, enumerare) - daca expresia e nenula se executa instructiunel, altfel instructiune? - un else e asociat intotdeauna cu cel mai apropiat if instructiunea switch ( expresie-intreaga ) instructiune - se evalueaza expresia (de tip intreg, posibil limitata la 1023 valori) - daca in corpul instructiune (compusa) exista o eticheta case cu valoarea intreaga obtinuta, se sare la instructiunea respectiva - daca nu, si exista o eticheta default, se sare la acea instructiune - altfel nu se executa nimic (se trece la instructiunea urmatoare) - pt acelasi cod la mai multe etichete: case vall: case val2: sir-instr Obs: Executia nu se opreste la urmatorul case (e doar o eticheta); iesirea din switch: doar cu instruct break sau la sfarsitul corpului! => permite utilizarea de cod comun pe ramuri, dar cu mare atentie! Programarea calculatoarelor 2 Curs 3 Marius Minea char c; int a, b, r; printf("Scrieti o operatie intre doi intregi: "); if (scanf("%d %c %d", &a, &c, &b) == 3) {  * * toate 3 corect *  switch (c) { case *+*: r = a + b; break; case r = a - b; break; default: c = ? 0?; break; case c =  * case ***: r = a * b; break; case *  ?: r = a   b;  * 1  * iese din corpul switch *   * idem *   * fanion caracter eronat *  e tot inmultire, continua *   * ca si pt '*' apoi iese *  i sfarsit nu trebuie break *  } if (c) printf("Rezultatul: %d %c %d = %d n", a, c, b, r); else printf("Operatie necunoscuta n"); } else printf("Format eronat n"); Programarea calculatoarelor 2 Curs 3 Marius Minea Declaratii instructiuni 21 Declaratii instructiuni instructiunile si (ciclurile cu test initial si final) while ( expresie ) instructiune do instructiune while ( expresie ); - ambele executa instructiunea atat timp cat valoarea expresiei (de tip scalar) e nenula (adevarata) - difera momentul de evaluare a expresiei (inainte dupa fiecare iteratie) Obs: in Pascal, din repeat untii se iese pe conditie true (invers!) exp-init; while (exp-test) { instructiune; exp-cont; for (exp-init ; exp-test ; exp-cont) instructiune e echivalenta* cu: * exceptie: instructiunea continue, vezi ulterior - oricare din cele 3 expresii poate lipsi (dar cele doua ; raman) - daca exp test lipseste, e tot timpul adevarata (ciclu infinit) in C99 (ca si in C++) se permite ca expresia exp-init sa fie inlocuita cu o declaratie de variabile (evtl initializate) cu domeniu de vizibilitate intreaga instructiune for (int i = 0; i = 0; ) if (tCil == v) break; if (i == -i) printf("nu s-a gasit n"); else printf("gasit la pozitia %d n", i); Programarea calculatoarelor 2 Curs 3 Marius Minea Declaratii instructiuni 25 Declaratii instructiuni 26 - produce trecerea la sfarsitul iteratiei intr-un ciclu while, do sau for incepand cu testul pt while si do, si cu ехргЗ (actualizare) pt for (controlul trece la punctul din ciclu de dupa ultima instructiune) - la fel, cod mai lizibil, daca partea neexecutata din iteratie e complexa for (d = 2; ; d++) {  * descompune n > 1 in factori primi *  if (n '  d != 0) continue;  * nu se imparte, urmatorul! *  exp = 0; do  * repeta de cate ori d e factor *  exp++; while ((n  = d) % d == 0); printf ("* "d"* "d ", d, exp);  * scrie factorul curent *  if (n == 1) break;  * am terminat *  Programarea calculatoarelor 2 Curs 3 Marius Minea Sintaxa: goto eticheta ; Efectul: se sare la executia instructiunii cu eticheta specificata Obs: orice instructiune poate fi etichetata optional etichets : instr - instructiunea goto nu corespunde principiilor programarii structurate - de evitat: duce usor la programe dificil de inteles si analizat - orice program poate fi rescris fara folosirea lui goto (eventual utilizand teste si sau variabile boolene suplimentare) - poate fi totusi utila, ex pentru iesirea din mai multe cicluri incuibate while ( ) {  * scriem intr-un fisier, linie cu linie *  while ( ) {  * prelucram cuvintele si spatiile din linie *  if (eroare la scriere) goto eroare;  * abandoneaza ciclurile *  } } eroare:  * cod pt tratarea erorii *  Programarea calculatoarelor 2 Curs 3 Marius Minea Declaratii instructiuni 27 Declaratii instructiuni 28 Pentru a fi convinsi ca programul e corect, demonstram ca executia sa are efectul dorit => formalism matematic (Floyd’67, Hoare’69) Corectitudine partiala: {P} S {Q} daca S e executat intr-o stare care satisface P, si executia lui S se termina, starea rezultanta satisface Q : definite pentru fiecare tip de instructiune in parte; prin combinatia lor, se poate rationa despre programe intregi : -—-— —— -—- unde Q  t E  e substitutia lui к cu Ein Q {Q[x E]} x := E {Q} Ex: { r- = у - 2} x := x + 2 { r- = y} (in rezultat, x= y, substituim x cu expresia atribuita, x + 2 si obtinem x + 2 = y, deci x = у - 2) {P} Si {Q} {Q} Si W {P}Si:S2{fl} {PAP}S!{Q} {P^E}S2{Q} {P} if E then Si else S2 {Q} (initial): cheia in rationamentul despre programe - trebuie gasit un i = o proprietate mentinuta adevarata de fiecare executie a ciclului (exprimata in punctul dintre iteratii) - daca intram in ciclu (E), invariantul e mentinut dupa o iteratie S - daca nu mai intram ( iB), invariantul implica concluzia Q {i    E} S {1} i    ^E=>Q {1} while E do S {Q} while (lo m)  * ambele cazuri mentin lo m => n >= m+1 => n >= lo *  else hi = m;  * !(n n n lo==n && n==hi *  Programarea calculatoarelor 2 Curs 3 Marius Minea Programarea calculatoarelor 2 Curs 3 Marius Minea Declaratii instructiuni Declaratii instructiuni 30 double fabs(doubie x); valoarea absoluta a lui x double fioor(doubie x); partea intreaga [xj a lui x, ca double double ceil(double x); cel mai mic intreg [x] nu mai mic de x double trunc(double x); truncheaza argumentul la intreg, inspre 0 (Obs: directia de rotunjire poate fi controlata cu fgetroundO si fsetroundO din fenv h, detalii in standard) double nearbyint (double x); rotunjesc in directia curenta cu  double rint(double x)  fara exceptie de argument inexact (implementarea tratarea exceptiilor e definita in standard, v fenv h) double round(double x): rotunjeste Jumatatile in directia opusa lui zero long int irint(double x); long int lround(double x); ca si rintO, roundO dar rezultat intreg; nedefinit in caz de depasire Functiile din math h au variante cu sufixele f si 1 cu argumente si rezultate float sau long double Exemple: float fabsf (float); long double fabsldong double); Programarea calculatoarelor 2 Curs 3 Marius Minea double exp(double x); double exp2(double x); double log(double x); double loglO(double x); double pow(double x); double sqrt(double x); returneaza ex returneaza 2Ж returneaza logaritmul natural inx double log2(double x); log in baza 10 si 2 returneaza xy returneaza ^ x acos, asin, atan, cos, sin, tan, acosh, asinh, atanh, cosh, sinh, tanh (valori unghiulare in radiani; inversele returneaza valori principale) double atan2(double y, double x); returneaza arctg(y x) in intervalul [—7г,7г], determina cadranul dupa semnele ambelor argumente Programarea calculatoarelor 2 Curs 3 Marius Minea Tipuri Operatori Expresii 13 octombrie 2002 Un : determina multimea valorilor pe care le poate lua o variabila, si operatiile care pot fi efectuate - reprezentate pe un numar de octeti => set de valori (chiar daca in matematica, domeniile pentru intregi si reali sunt nelimitate) => Atentie la depasiri ii! Limbajul C are doar cateva tipuri de baza - char: caractere, reprezentate pe 1 octet (8 biti) - int: numere intregi - float: numere reale (virgula mobila), in precizie simpla - double: numere reale, in dubla precizie Domeniul de valori pentru intregi si reali e dependent de arhitectura (de obicei, corespunde natural cu dimensiunea registrilor procesorului) Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea Tipuri Operatori Exnresii Tipuri Operatori Expresii in memoria calculatorului, numerele se reprezinta in binar (baza 2) Valoarea unui , cu к cifre binare (biti): CA -VA-2 • • • cico (2) = ca—i * 2a 1 + • • • + "1 * 21 + c0 * 2° = bitul cel mai semnificativ (superior) cp = bitul cel mai putin semnificativ (inferior) Exemple: 11111111 == 255; cp = 0 => nr par; cp = 1 => nr impar intregi : reprezentate in complement de 2 daca bitul superior e 1, nr se considera negativ valoarea: translatata cu 2k in Jos fata de interpretarea fara semn lca 2 cicp (2) = -2a' 1 + ca 2 * 2a' 2 + + ci * 21 + cp * 2° Exemple (pe 8 biti): 11111111 == -1; 10000000 == -128 (float: semn, exponent, mantisa) S EEEEEEEE MMMMMMMMMMMMMMMMMMMMMMM (1+8+23 biti) pt 0 - int, short: > 2 octeti, minim [—215, 215 - 1] = [-32768, 32767] - long: > 4 octeti, acopera minim [-231 (-2147483648) , 231 - 1] - long long: > 8 octeti, acopera minim [-263, 263 - 1] - unsigned pastreaza dimensiunea; intre 0 si 2s ‘ - 1 (b = nr octeti) - sizeof(short) folositi sizeof pentru a scrie programe portabile Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea Tipuri Operatori Expresii Tipuri Operatori Expresii - in baza 10: scrise obisnuit; ex -5 -in baza 8: cu prefix cifra zero; ex 0177 (127 zecimal) - in baza 16: cu prefix 0x sau 0X; ex 0xA9 (169 zecimal) - sufix u sau U pentru unsigned, ex 65535u - sufix 1 sau l pentru long ex 0177777L - caractere tiparibile, intre ghilimele simple: ’0’, ’!’, ’a’ caractere speciale: * n* linie noua ’ 0’ nuli carriage return ’ b’ backspace apostrof (ghilimea) ’ t’ tab > v backslash - caractere scrise in octal (max 3 cifre), ex: ’ 14' - caractere scrise in hexazecimal (prefix x), ex ’ xff’ ASCii = American Standard Code for information interchange Caracterele sunt memorate ca si cod numeric = indicele in acest tabel ex ’0’ == 48, ’A’ = 65, ’a’ = 97, etc 0 1 2 3 4 5 6 7 8 9 A В с D E F 0x0  0  a  b  t  n  v  f  r 0x10: 0x20: i и # s 7 & } ( ) * + -   0x30: 0 1 2 3 4 5 6 7 8 9 ? 0x40: Q A В c D E F G H i J К L M N 0 0x50: P Q R s T U V W X Y Z [   ] 0x60: 0x7f (127): nu fac parte din setul ASCii (diacritice, etc - diverse variante standardizate de iSO) Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea Tipuri Operatori Expresii Tipuri Operatori Expresii Numerele reale: reprezentate cu semn, mantisa, si exponent => domeniul de valori e simetric fata de zero => precizia se defineste relativ la modulul numarului Exemple de dimensiuni (compilator gcc pe І386, sub Linux): - float: 4 octeti, intre cca iO-38 si iO38, 6 cifre semnificative - double: 8 octeti, intre cca iO-308 si iO308, 15 cifre semnificative - pentru precizie suplimentara: long double (12 octeti) : valori minime cerute de standard SHRT-MiN, iNT MiN -32767 LONG MiN -2147483647 USHRT MiN, UiNT MiN 65535 SHRT MAX, iNT MAX 32768 LONG MAX 2147483647 ULONG MAX 4294967295 Obs: pe gcc i386 Linux, int are aceleasi dimensiuni ca si long : valori pt gcc i386 Linux (si cerintele standard) - contin mantisa, iar optional semn si exponent (prefix e sau E) -in mantisa, partea reala sau zecimala poate lipsi, dar nu amandoua - implicit, orice constanta reala e considerata double - sufix f sau F pentru float; 1 sau l pentru long double Exemple: 1 0 sau 1 sau lei 3 14159265358979323846 1 175494e-38f FLT DiG 6 FLT MiN FLT MAX FLT EPSiLON DBL MiN DBL MAX DBL EPSiLON DBL DiG 15 (min 10)  * precizie zecimala *  1 17549435e-38F (max 1E-37) 3 40282347e+38F (min 1E+37) 1 19209290e-07F (max 1E-5)  * nr min cu 1+eps > 1 *  2 2250738585072014e-308 (max 1E-37) 1 7976931348623157e+308 (min 1E+37) 2 2204460492503131e-16 (max 1E-9) Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea Tipuri Operatori Expresii Tipuri Operatori Expresii 10 - int (chiar long): domeniu de valori mic (cca ± 2 miliarde) - e insuficient pentru multe calcule care implica aparent intregi Ex calculati e-1, = 1 - ar1 !! + ;v2 2! - cu o precizie data (iO-5) Daca se calculeaza factorialul ca intreg, va da depasire pt n > 12 mai bine: fara factorial, cu recurenta intre termeni: ln = ln i *x n - pana la 9E15 tipul double distinge inca doi intregi consecutivi - o valoare citita de la intrare nu e reprezentata neaparat precis! float x; scanf("7 f", tac); printf ("7 7f", x); 4 2 , 4 1999998 fractii exacte in baza 10 pot fi periodice in baza 2 1 2(10j = l (OOll)p) -in calcule matematice, adeseori comparatia == e insuficienta (pot apare pierderi de precizie pe parcurs) - mai bine: fabsCx - y) 1 Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea Operatorul sizeof returneaza numarul de octeti de memorie ocupati de un tip de date (sau o variabila sau constanta): #include void main (void) printf("char t t%d n",sizeof(char)); printf("short t t%d n",sizeof(short)); printf("int t t%d n",sizeof(int)); printf("long t t%d n",sizeof(long)); printf("float t t%d n",sizeof(float)); printf("double t t%d n",sizeof(double)); printf("long double t%d n",sizeof(long double)); Caracterul > t* (tab) sare la alinierea urmatoare (tipic: 8 caractere) Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea Tipuri Operatori Expresii 11 Tipuri Operatori Expresii 12 -operatorii uzuali binari: +, *,   pentru numere intregi si reale ATENTE: pentru intregi,   inseamna impartire cu rest - operatorul 7 (numai pentru intregi): modulo (restul la impartire) 9 -5==-l 97 -5==4 -9 5=-l -97 5=-4 -9 -5==l -97 -5=-4 (restul are semnul deimpartitului) - operatorul unar - (minus; nu exista plus unar) in expresii aritmetice, caracterele sunt considerate ca si intregi (indicele caracterului respectiv in tabela ASCii) Exemplu: ’7’ - ’0’ == 7, ’a’ + 5 == ’f’ (cifrele, respectiv literele ocupa spatiu continuu in tabela de caractere) Precedenta: - unar, apoi *,  , 7 , apoi +, - Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea - C nu are tip boolean; se foloseste int (C99: Tool, stdbool h) - operatorii logici produc 1 pt true, 0 pt false - un intreg e interpretat ca true daca e yt 0 si ca false daca e 0 : precedenta mai mica decat cei aritmetici x , >=, <> se poate scrie natural (x determina semnul caracterelor cu bitul 7 pe 1, si implicit semnul la conversia char -> int la conversia comparatia intre int si unsigned !! valorile > int max sunt considerate negative ca int => rezultate incorecte   surprinzatoare   neintuitive int i; unsigned u = 3000000000;  * u > iNT MaX *  i = u + 5;  * bitul de semn 1 => i e considerat negativ *  if Ci > u) printf ("7 d > 7,u n", i, u);  * tipareste: -1294967291 > 3000000000 !! ! *  Pentru a compara int i cu unsigned u - inlocuiti Ci u) cu Ci > 0 && i > u) Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea Tipuri Operatori Expresii Tipuri Operatori Expresii 16 : partea dreapta convertita la tipul partii stangi - e posibila trunchierea daca atribuim la un tip de dimensiune mai mica => mesaje de avertizare de la compilator Exemplu: int i; char c; i = с; c = i;  * valoarea se pastreaza *  c=i; i = c;  * bitii superiori se pierd *  partea dreapta e evaluata independent de tipul partii stangi! unsigned eur rol = 38400, usd rol = 32700; float eur usd; eur usd = eur rol   usd rol;  * 1 !! ! *  (engl type cast) Sintaxa: ( nume tip ) expresie expresia este convertita ca in atribuirea unei variabile de tipul dat eur usd = (double) eur rol   usd rol;  * 1 17 *  int n; sqrt ((double)n);  * double sqrt(double) in inath h *  Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea propriu-zisa: var = expr (un operator ca oricare altul) => o expresie de atribuire poate fi folosita in alta expresie compusa (si valoarea ei e chiar cea a expresiei atribuite) a = b = c  * asociativ la dreapta, a = (b = c) *  if (Ce = getcharO) != ’ n’) {  * folosim rezultatul in test *  } : Nu gresiti folosind atribuirea in loc de test de egalitate!! if (x = y) testeaza daca valoarea lui у (atribuita si lui x) e nenula : += -= *=  = • ,= x += expr e o forma mai scurta de a scrie x = x + expr vezi ulterior si pentru operatorii pe biti " " & * i prefix postfix: ++ — ++i incrementare cu 1, valoarea expresiei este cea de dupa atribuire i++ incrementare cu 1, valoarea expresiei este cea dinainte de atribuire int x=2, y, z; у = x++;  * y=2,x=3 * ; z = ++x;  * x=4,z=4 *  Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea Tipuri Operatori Expresii 17 Tipuri Operatori Expresii 18 - numara caracterele din sirul s in variabila i for Ci = 0; s[i] != ’ 0’; i++);  * sirul se termina cu ’ 0’ *  sau, cu un test implicit de valoare nonzero, si preincrement: for Ci = -1; s[++i]; );  * corpul lui for este vid *  - copiaza sirul src in sirul dest; expresia atribuita serveste si pt test for Ci = j =0; dest[j++] = src[i++]; ); - copiaza max N caractere; cand primul test e fals, se omite al doilea (deci nu se mai executa atribuirea) for Ci = j = 0; i o expresie care contine mai multi operatori cu efect lateral poate avea rezultat   efect nedeterminat Exemple eronate: int i = 0; printf ("7,d ’ ,d", i++, i++);  *0 1 sau 1 0 * ); (argumentele unei functii se pot evalua in orice ordine) while Cs[i] b) ? a : b;  * max(a, b) *  printf("Numarul este 7 s n", (n 3 double f(double x) return x = -3 : x = -3 ? (x — 3 inca nu stim raspunsul , intrebam x 3 ? 6 : 2*x) daca x nu e 3, inseamna ca x e [—3, 3] Expresia conditionala se poate folosi oriunde trebuie o expresie Exemplu: expresie de tip sir in printf (programul afiseaza ce fel de caracter a fost introdus): #include #include int main(void) int c = getcharO;    var initializata cu caract citit printf(isupper(c) ? "e litera mare" : islower(c) ? "e litera mica" : isdigit(c) ? "e cifra" : "nu e nici litera nici cifra"); putchar(’ n’); return 0; Permite sa rezolvam o problema: 1) gasind un caz de baza, cand 2) un pas in care rezolvam ( functie cu unsigned sum to(unsigned n) return n == 0 ? 0 : sum to(n - 1) + n; putem da raspunsul direct problema )    suma de la 1 la n    nu avem ce aduna: 0    (1 + + n-1) + n Expresia: efectueaza un calcul operatii aritmetice: x + 1 apel de functie: fact (5) instructiunea: executa o actiune return n + 1; Orice la care se adauga devine instructiune n + 3; (calculeaza, dar nu face nimic cu rezultatul) printf ("hello! ") ; nu folosim rezultatul lui printf ci ne intereseaza , tiparirea printf returneaza un int: numarul de caractere scrise (rar folosit) instructiunile se scriu si executa una dupa alta ( ) Cu decizie, recursivitate si secventiere putem scrie orice program : mai multe instructiuni intre { } Corpul unei functii e o instructiune compusa ( ) instructiune int c = getcharO; printf("tiparim caracterul: "); instructiune put char (c); } } instructiunea compusa e considerata o singura instructiune Poate contine declaratii: oriunde (C99 Cll) la inceput (ANSi C) Orice instructiune care compusa se termina cu punct-virgula Pentru expresii e virgula: exprl expr2 Se evalueaza exprl, se ignora, valoarea expresiei e cea a lui expr2 ? : selecteaza din doua de evaluat selecteaza intre de executat if expresie sau if expresie instructiunel instructiunel else instructiune2 Daca expresia e se executa instructiunel, altfel se executa instructiune2 (sau nimic, daca nu exista) ? : selecteaza din doua de evaluat selecteaza intre de executat if expresie sau if expresie instructiunel instructiunel else instructiune2 Daca expresia e se executa instructiunel, altfel se executa instructiune2 (sau nimic, daca nu exista) Fiecare ramura are instructiune Daca sunt mai multe instructiuni, trebuie grupate intr-o { } din jurul conditiei sunt obligatorii 0 ramura apartine intotdeauna de if : if (x > 0) if (y > 0) printf("x+, y+"); else printf("x+, у Tiparirea solutiilor ecuatiei de gradul ii: void printsol(double a, double b, double c) double delta =b*b-4*a*c; if (delta >= 0) { printf("solutia 1: %f n", (-b-sqrt(delta)) 2 a); printf("solutia 2: %f n", (-b+sqrt(delta)) 2 a); } else printf("nu are solutie n"); } Putem rescrie cu int abs(int x) int abs(int x) { "L if (x > 0) return x; return x > 0 ? x : -x; else return -x; ? } #include void prininat(unsigned n) {    tipareste recursiv nr nat if (n >= 10)    daca are mai multe cifre prininat(n 10);    scrie si prima parte putchar(’O’ + n 7 10);    oricum, scrie ultima cifra int main(void) prininat(312); return 0; din instructiunea sau operatorul e deobicei o , cu : x ! = 0, n conditia in if trebuie sa aiba tip (intreg, real, enumerare) Corespunzator: intorc in C valorile 1 (pentru (== ! = putem scrie natural x >= corpul se executa repetat atat timp cat conditia e adevarata Putem defini iteratia recursiv: while expresie instructiune are acelasi efect ca: if expresie instructiune while expresie instructiune } unsigned fact r(unsigned n, unsigned r) { return n > O ? fact r(n - 1, r * n) : r;    se apeleaza cu fact r(n, 1) int pow r(int x, unsigned n, int r) { return n > O ? pow r(x, n-1, x*r) : r;    apelat cu pow r(x, n, 1) unsigned fact it(unsigned n) { unsigned r = 1; while (n > 0) { r = r * n; n = n - 1; return r; int pow it(int x, unsigned n) { int r = 1; while (n > 0) { r = x * r; n = n - 1; return r; Se face mai direct daca functia recursiva e scrisa cu acumularea rezultatului partial r, transmis ca parametru (tail recursion) Testul de oprire si valoarea initiala pentru rezultat raman aceleasi in varianta recursiva, fiecare apel creeaza de parametri, cu valori proprii (in functie de cele vechi): ex n * r, n - 1, x * r, etc Varianta iterativa la fiecare iteratie valorile variabilelor, dupa aceleasi relatii Ex r = n * r, n = n - 1, r = x * r Ambele variante returneaza valoarea acumulata a rezultatului : si recursivitatea si iteratia repeta prelucrari => intr-o prelucrare folosim una sau cealalta, rareori amandoua! #include    pentru isdigitO #include    pt getcharO, ungetcO, stdin unsigned readnat(void) int c; unsigned r = 0;    caracterul si rezultatul while (isdigit(c = getcharO))    cat timp e cifra r = 10*r + c - ’0’;    compune numarul ungetc(c, stdin);    pune inapoi ce nu-i cifra return r; int main(void) { printf("numarul citit: 70u n", readnatO); ungetc(c, stdin) pune inapoi caracterul c in intrarea standard Caracterul va fi citit la urmatoarea citire, de ex cu getcharO Ex : functie care citeste si tipareste pana la un caracter dat; returneaza acel caracter sau EOF daca nu a aparut int printto(int stopchar)    pana la ce caracter int c; while ((c = getcharO) != EOF && c != stopchar) putchar(c); return c; (c=getchar()) !=E0F (atribuie, apoi compara int skipto(int stopchar)    ignora pana la stopchar int c; while ((c = getcharO) != EOF && c != stopchar); return c; ; dupa while ( ) e (nu face nimic) in alte cazuri (din greseala) do instructiune while ( expresie ); Uneori stim sigur ca un ciclu trebuie executat cel putin o data (citim cel putin un caracter, un numar are macar o cifra, etc ) Ca si ciclul cu test initial, executa instructiune atat timp cat executia expresiei e nenula (adevarata) Expresia se evalueaza insa fiecare iteratie instructiune Echivalent cu: while ( expresie instructiune Marius Minea marius@cs upt ro http:  www cs upt ro  marius curs f i 17 octombrie 2012 logica = ratiune "Nu are logica!" = e irational (sau: nu stie sa gandeasca) E necesara dincolo de programare si stiinta calculatoarelor in rationamente, argumente, etc Baza pentru (cum deducem ? cum reprezentam cunostiinte?) in inginerie software cum exprimam si despre ce face un program? cum ca un program e corect? cum scriem automat care urmaresc caile printr-un program? Unul din cele mai simple (limbaj putem asa cum codificam numere, etc in putem exprima probleme prin in logica ceva) Probleme de discutat: Cum reprezentam o formula ca sa putem opera eficient cu ea Fiind data o formula, poate fi adevarata ? (realizabilitate, engl satisfiability) => SAT checking stim deja: operatorii logici sl (A), SAU (V), NU (->)   F 'P F negatie NU pAq F q T F F F p T F T conjunctie sl pVq F q T F F T p T T T disjunctie SAU p^q Semnificatie: daca p e adevarat, atunci q e adevarat (if-then) daca p nu e adevarat, nu stim nimic despre q (poate fi oricum Deci, p —> q e fals doar daca p e adevarat si q e fals (q ar trebui sa fie adevarat) q p q F T F T T T F T Atentie! implica orice! => un rationament cu o veriga falsa poate duce la orice concluzie implicatia nu inseamna cauzalitate un fapt adevarat implica orice fapt adevarat (fara legatura) fals implica orice logicii prepozitionale: format din : p, q, r, etc (conectori logici): > paranteze ( ) pentru logicii prepozitionale: orice propozitie atomica este o formula daca a este o formula, atunci (-o) este o formula daca a si (3 sunt formule, atunci (a —> (3) este o formula Operatorii cunoscuti pot fi definiti folosind -> si —>: а Л  3 d= -i(a —> -1 5) а V (3 d= -ia —> (3 a o (3 d= (a —>  5) Л ( 3 —> a) (am renuntat la parantezele redundante) о v atribuie la orice formula o {T, F} astfel incat: v(p) e definita pentru fiecare propozitie atomica p ' (-a) = | p daca v(a) = F daca v(a) = T v(O! —> ?) = b) —> c: avem v(a —> b) = F pentru ca v(a) = T si v(b) = F si atunci v((a —> b) —> с) = T pentru ca v(a —> b) = F О а unei formule = о evaluare pentru propozitiile ei 0 intrepretare o formula daca o evalueaza la T (interpretarea e un pentru formula respectiva) Exemplu: interpretarea v(a) = T, v(b) = F, v(c) = T satisface formula а Л (->Ь V ->c) Л (-іа V c) interpretarea v(a) = T, v(b) = T, v(c) = T nu o satisface O formula poate fi: ( ): adevarata in toate interpretarile (satisfiable): adevarata in cel putin o interpretare nerealizabila ( ): falsa in orice interpretare V —>з - а о а (з V Ь) о -іа Л -ib {з Л b) о -із V ->Ь (regulile lui de Morgan) э —>  >) Л (-13 —> с) о (з Л b) V (-13 Л c) —> (b —> с) о (зЛ b) ч c O multime de formule H = { 72 deducem 72) si un set de (formule care pot fi folosite ca premise ipoteze) Al: a —> ( 3 —> a) A2: (a -> ( 3 -> 7)) ((a ->  3) -> (a -> 7)) АЗ: (-1 3 —> -ia) —> (a —>  3) Fie H o multime de formule 0 (demonstratie) din H e un sir de formule Ai, A2,       , An, astfel ca: 1 A,- este o axioma, sau 2 А,- este o formula din  7, sau 3 А  rezulta prin MP din Aj, А к anterioare (j, к p (1) P (( p MP(3,4) unei demonstratii e un proces simplu, mecanic (cele 3 reguli de mai sus), chiar daca gasirea demonstratiei poate fi dificila H h ip : (pur sintactica, din axiome si reguli de deductie) H |= tp : (semantica, bazat pe tabele de adevar) Care e legatura intre ele ? : Daca  7 e o multime de formule, si a este o formula astfel ca H h a, atunci H |= a (Orice teorema in logica prepozitionala este o tautologie) : Daca  7 e o multime de formule, si a este o formula astfel ca H |= a, atunci H a (Orice tautologie este o teorema) Ca sa demonstram o formula, putem arata ca a Pentru aceasta, verificam ca Conjunctive normal form (CNF) Formula scrisa ca o de Fiecare clauza e o de (propozitie atomica sau negatia ei) (а V V -id) Л (-іа V ->b) Л (-іа V с V -id) Л (-іа V b V c) Problema: cum convertim o functie in CNF? ML permite definirea simpla de reprezentari cu alternative (inclusiv recursive) type boolexp = id of string i Not of boolexp i And of boolexp * boolexp i Or of boolexp * boolexp identificatorii {constructorii de tip) id, And, etc sunt alesi de utilizator (ca niste etichete care identifica varianta) Prelucrarea se face prin potrivire de tipare: match e with Not e -> i And (el, e2) -> Compilatorul avertizeaza daca nu tratam toate variantele modulul Scanf, functia scanf open Scanf (scriem simplu scanf, nu Scanf scanf) Folosirea: scanf format functie-de-valori-citite Formate (similar cu limbajul C) %c %d %f %s caracter %0c fara sa-l consume (pentru test) intreg real sir %[caractere] sir din caracterele permise (sau л pt excluse) spatiu in format: ignora 0 sau oricate spatii albe numar dupa %: max atatea caractere Valorile citite sunt in functia data: let f () = scanf "70d %c 70d" (fun x op у -> if op = ’+’ then x + у else 0) Formula ::= Term | Formula ’+’ Term Term ::= Factor | Term Factor Factor ::= id | id | ’(’ Formula ’)’ Pentru a citi efectiv o formula, modificam gramatica asa incat sa putem decide dupa primul caracter ce varianta trebuie urmata: Formula ::= Term RestForm RestForm ::= e | ’+’ Term RestForm Term ::= Factor RestTerm RestTerm ::= e | Factor RestTerm in program, functiile pentru RestForm RestTerm au ca parametru termenul factorul citit inainte, pentru a-l putea grupa cu urmatorul 10 martie 2009 Programarea calculatoarelor Curs 3 Marius Minea Recursivitate Citirea caracterelor Declararea variabilelor 2 — recursiv, rezolvam o problema reducand-o la o problema mai simpla - adesea, e eficienta impartirea in doua probleme cat mai egale = strategie (divide and conquer) double sqr(double x) { return x*x; } double pow2(double x, unsigned n) { il n = 0 return n == 0 ? 1 ( rr, 2)2 n par n % 2 == 0 ? sqr(pow2(x, n 2)) ж (^ 2)2 n impar ; x * sqr(pow2(X; n 2)); - numarul de apeluri necesar e 1 + L,o92nJ (exponentul se injumatateste la fiecare apel recursiv) de ex : pow2(5, 6) pow2(25, 3) pow2(625, 1) pow2(625, 0) - evaluarea lui pow(x, n 2) se face o singura data ca argument pt sqr care lucreaza cu obtinuta ( de doua ori) Programarea calculatoarelor Curs 3 Marius Minea Recursivitate Citirea caracterelor Declararea variabilelor 3 - daca жп 2 • жп 2 in locul functiei sqr si tiparim exponentul pentru a urmari desfasurarea apelurilor recursive: obtinem pentru exponent n = 3: double pow2(double x, unsigned n) { printf ("exponent ° ou n" , n) ; return n == 0 ? 1 : n % 2 == 0 ? pow2(x, n 2) * pow2(x, n 2) : x * pow2(x, n 2) * pow2(x, n 2); exponent 3 exponent 1 exponent 0 exponent 0 exponent 1 exponent 0 exponent 0 - cele doua expresii pow(x, n 2) se evalueaza ! fara optimizari, compilatorul nu cauta expresii egale, si - nr de apeluri e mai mare decat la inmultirea obisnuita x • • x => la repetarea ineficienta a rezolvarii acelorasi subprobleme Programarea calculatoarelor Curs 3 Marius Minea Recursivitate Citirea caracterelor Declararea variabilelor 4 - dar, putem rescrie definitia chiar mai simplu: 1 (ж2)71 2 X • (ж2)71 2 n = 0 n par n impar double pow2(double x, unsigned n) { return n == 0 ? 1 : n % 2 == 0 ? pow2(x*x, n 2) : x * pow2(x*x, n 2); (similar cu prima varianta, dar nu mai e nevoie de sqr) se transmite calculata a lui x*x, NU se substituie expresia! => uneori o mica reformulare a problemei duce la o solutie foarte diferita Programarea calculatoarelor Curs 3 Marius Minea Recursivitate Citirea caracterelor Declararea varie Fq — Fi — 1, Fn — Fn i + Fn 2 (n unsigned fib(unsigned n) { printf ( " calculez f ib (° od)  n" , n) ; return n b ? a : b; } unsigned maxeifra(unsigned n) {    cifra maxima din numar return n 0> == 48, ’A’ == 65, ’a’ == 97, etc 0123456789ABCDEF 0x0  0  a  b  t  n  v  f  r 0x10: 0x20: ! " # s % & ’ ()*+,-   0x30: 0123456789: ; ? 0x40: OABCDEFGHiJKLMNO 0x50: PQRSTUVWXYZ [   ]   0x60: ‘abcdefghijklmno 0x70: pqrstuvwxyzf | } Prefixul 0x denota constante hexazecimale (in baza 16) - caracterele poate fi memorat pe (8 ) Cf standardului, char poate fi , cu valori de la -128 la 127, sau , cu valori de la o la 255 Ambele sunt incluse in int in program, se scriu intre apostroafe (simple) > > Au valori intregi: codul ASCii in calcul se convertesc automat la int Cifrele, literele mici si literele mari sunt dispuse => avem: 7> == + 7 ’5’ Reprezentari pentru caractere speciale: 0’ == 5 ’E’ - ’A ’ 0’ nuli ’ a’ alarm ’ b’ backspace ’W tab ’ v ’ vertical tab == 4 == + 5 ’ n’ linie noua ’ r’ carriage return ’ f’ form feed apostrof ’ V backslash Programarea calculatoarelor Curs 3 Marius Minea Recursivitate Citirea caracterelor Declararea variabilelor 11 int getchar(void) ; ( in stdio h) : getcharO fara parametri, returneaza caracterul (codul ASCii) ca unsigned char convertit la int, sau returneaza valoarea EOF (-1, nu e unsigned char) daca nu s-a citit un caracter (la sfarsit de fisier, end-of-file) La tastatura, caracterele sunt introduse cu ecou, intr-un tampon, si pot fi preluate de program (ex getcharO doar dupa tastarea Enter ATENtiE! Programul nu are control asupra datelor introduse la citire => trebuie si tratate erorile int putchar(int c) ; ( in stdio h) ex : putchar(’ 7 O — un unsigned char (dat ca si int); returneaza valoarea scrisa #include int main(void) { putchar О АО; putcharO:O;    scrie caracterul A apoi : putchar(getcharO);    scrie un caracter citit return 0; Programarea calculatoarelor Curs 3 Marius Minea Recursivitate Citirea caracterelor Declararea variabilelor 12 Folosim tot definitia recursiva a numarului, evidentiind ultima cifra Fie numarul ciC2 cm, si secventele partiale q, ciC2, 0^0203, Avem: vq = 0, rk = 10 • rk ± + ck, (k > 0) Definim recursiv o functie care calculeaza numarul pornind de la rk 1 si cifra curenta ck: - cand caracterul citit nu mai e cifra, numarul e gata format in r - altfel, continuam recursiv de la 10-r + c, citind urmatorul caracter tinem cont ca getcharO returneaza codul ASCii, nu valoarea cifrei => ajustam cu -’0’, de ex 6 == ’6’ - ’0’ #include    pt functia isdigit (caract e cifra ?) #include    citeste nr nat cat timp vede cifre, r = val partii deja citite unsigned readnat rc(unsigned r, int с) {    c = urm caracter citit return isdigit(c) ? readnat rc(10*r + (c-’O’), getcharO) : r; Programarea calculatoarelor Curs 3 Marius Minea Recursivitate Citirea caracterelor Declararea variabilelor 13 Ca solutie finala, scriem o functie fara parametri auxiliari: int readnat(void) { return readnat rc(0, getcharO); } Completam cu o functie care citeste un intreg, ce poate avea si semn: int readint c(int c) {    tine cont de semn; c: primul caracter return c == ? - readnatO • ? readnatO : readnat rc(0, c) ; int readint(void) int main(void) { printf("numarul return 0; { return readint c(getchar()); }    fara param citit este: ° od n", readint()); Programarea calculatoarelor Curs 3 Marius Minea Recursivitate Citirea caracterelor Declararea variabilelor 14 Un calcul pur nu are alte efecte: urmatorul program nu scrie nimic! int sqr(int x) { return x * x; } int main(void) { return sqr(2); } Apelul repetat al unei functii (in matematica, sau din cele scrise pana acum: sqr, fact, etc ) cu aceiasi parametri produce acelasi rezultat (repetitia poate fi ineficienta, dar rezultatul e acelasi, ex pow2, fib) in contrast, tiparirea (printf) produce un efect vizibil (si ireversibil) Citirea cu getcharO returneaza caracter din intrare la fiecare apel; caracterul e O modificare in starea mediului de executie a programului se numeste (ex citire, scriere, atribuire - v ulterior) Uneori e necesar sa memoram o valoare (caracter citit de la intrare, pentru a nu se pierde sau rezultat de functie, pentru a nu-l recalcula) Vom discuta cum se face aceasta prin unei Programarea calculatoarelor Curs 3 Marius Minea Recursivitate Citirea caracterelor Declararea variabilelor 15 La o problema (functie): ce se da (parametrii); ce se cere (rezultatul) Uneori, e nevoie de rezultate valori intermediare => Ex: citirea de numar: caracterul curent c nu e dat in enuntul problemei => e ceva ajutator, functia il poate citi singur Declaram o variabila: unsigned readnat r(unsigned r) { int c = getcharO;    declaram c, initializat cu caract citit return isdigit(c) ? readnat r(10*r + c - ’0’) : r; O e un obiect cu un nume si un tip Se foloseste la memorarea unor valori (altele decat parametrii de functie) necesare in calcule double x; : una sau mai multe variabile de acelasi tip: int a = 1, b, c; (a e initializat cu 1, restul nu) Declaram variabile cand e nevoie sa returnate de functii) pentru (de exemplu Programarea calculatoarelor Curs 3 Marius Minea Recursivitate Citirea caracterelor Declararea variabilelor 16 Un program С e o colectie de functii => e scris modular: fiecare functie rezolva o subproblema; programul principal main le apeleaza combina Numele parametrilor unor functii diferite nu se influenteaza; ca si in matematica putem avea  ( t) = si g(x) = => la fel pentru variabilele declarate in functii ( ) al unui identificator (de ex variabila) = partea de program unde poate fi utilizat (intelesul sau e cunoscut) Parametrii si variabilele declarate in functii au domeniul de vizibilitate corpul functiei => nu sunt vizibile in exteriorul functiei Variabilele locale au automata: sunt create la fiecare apel al functiei si distruse la incheierea acestuia (intre apeluri nu exista si deci nu isi pastreaza valoarea) Corpul { } unei functii C contine o secventa de declaratii si instructiuni -in C99, declaratiile si instructiunile pot aparea in orice ordine -in standardele anterioare: intai declaratii, apoi instructiuni Programarea calculatoarelor Curs 3 Marius Minea Recursivitate Citirea caracterelor Declararea varie Adaptam readnat: daca intalnim p #include #include double readfrac(double r, double int c = getcharO;    plO: pute return isdigit(c) ? readfrac(r double readreal r(double r) { int c = getcharO ; return isdigit(c) ? readreal r( c == ’? r + readfrac(O, 0 double readreal(void) { return re int main(void) { printf ("° of n" , readrealO); return 0; Programarea calculatoarelor Curs 3 abilelor 17 unct, citim partea fractionara plO) {    r: fractia acumulata rea subunitara a zecimalei curente + (c-,0,)*pl0, 0 1*pl0) : r;    valoarea acumulata: reala adreal r(0); } Marius Minea Recursivitate Citirea caracterelor Declararea variabilelor 18 Functie care inverseaza o linie de text si returneaza nr de caractere: inversarea recursiva unui sir: — daca sirul e vid, inversul e vid - altfel: punem primul element dupa inversul restului sirului => caracterul citit trebuie memorat pana inversam restul liniei #include unsigned revline(void) int c = getcharO ; unsigned len = ((c == ’ n’) ? 0 : 1 + revlineQ); putchar(c); return len; int main(void) printf (" nLinia a avut ° ou caractere n" , revlineQ); return 0; Programarea calculatoarelor Curs 3 Marius Minea 19 octombrie 2004 Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea Tipuri Operatori Expresii 2 Un : determina multimea valorilor pe care le poate lua o variabila, si operatiile care pot fi efectuate - reprezentate pe un numar de octeti => set de valori (chiar daca in matematica, domeniile pentru intregi si reali sunt nelimitate) => Atentie la depasiri !!! Limbajul C are doar cateva tipuri de baza - char: caractere, reprezentate pe 1 octet (8 biti) -int: numere intregi - float: numere reale (virgula mobila), in precizie simpla - double: numere reale, in dubla precizie Domeniul de valori pentru intregi si reali e dependent de arhitectura (de obicei, corespunde natural cu dimensiunea registrilor procesorului) Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea Tipuri Operatori Exoresii 3 in memoria calculatorului, numerele se reprezinta in binar (baza 2) Valoarea unui , cu к cifre binare (biti): ск гск 2       cic0 (2) = ck-x * 2fe 1 + + ci * 21 + c0 * 2° Cfc l = bitul ce! mai semnificativ (superior) c0 = bitul cel mai putin semnificativ (inferior) Exemple: 11111111 == 255; cq = 0 => nr par; cq = 1 => nr impar intregi reprezentate in complement de 2 daca bitul superior e 1, nr se considera negativ valoarea: translatata cu 2k in jos fata de interpretarea fara semn lCfc-2   •   C1C0 (2) = -2fc 1 + ck-2 * 2fc 2 + + Ci * 21 + c0 * 2° Exemple (pe 8 biti): 11111111 == -1; 10000000 == -128 (float: semn, exponent, mantisa) S EEEEEEEE MMMMMMMMMMMMMMMMMMMMMMM (Ц-8+23 biti) pt 0 - int, short: > 2 octeti, minim [—215, 215 - 1] = [-32768, 32767] - long: > 4 octeti, acopera minim [—231 (-2147483648) , 231 — 1] - long long: > 8 octeti, acopera minim [—263, 263 — 1] - unsigned pastreaza dimensiunea; intre 0 si 286 — 1 (b = nr octeti) - sizeof(short) folositi sizeof pentru a scrie programe portabile Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea Tipuri Operatori Expresii 5 -in baza 10: scrise obisnuit; ex -5 -in baza 8: cu prefix cifra zero; ex 0177 (127 zecimal) -in baza 16: cu prefix 0x sau 0X; ex 0xA9 (169 zecimal) — sufix u sau U pentru unsigned, ex 65535u - sufix 1 sau L pentru long ex 0177777L - caractere tiparibile, intre ghilimele simple: ’0’, 3!’, ’a’ - caractere speciale: ’ n’ linie noua ’ 0’ nuli ’ r’ carriage return ’ b’ backspace apostrof (ghilimea) ’ f tab ’W backslash - caractere scrise in octal (max 3 cifre), ex: ’ 14’ - caractere scrise in hexazecimal (prefix x), ex Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea Tipuri Operatori Expresii 6 ASCii = American Standard Code for information interchange Caracterele sunt memorate ca si cod numeric = indicele in acest tabel ex ’0’ == 48, ’A’ = 65, ’a’ = 97, etc 0123456789ABCDEF 0x0  0  a  b  t  n  v  f  r 0x10: 0x20: ! " # s % & ’ ()*+,-   0x30: 0123456789: ; ? 0x40: OABCDEFGHiJKLMNO 0x50: PQRSTUVWXYZ [   ]   0x60: ‘abcdefghijklmno 0x70: pqrstuvwxyzf | } - caracterele 0x7f (127): nu fac parte din setul ASCii (diacritice, etc - diverse variante standardizate de iSO) Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea Tipuri Operatori Expresii 7 Numerele reale: reprezentate cu semn, mantisa, si exponent => domeniul de valori e simetric fata de zero => precizia se defineste relativ la modulul numarului Exemple de dimensiuni (compilator gcc pe І386, sub Linux): - float: 4 octeti, intre cca iO-38 si iO38, 6 cifre semnificative - double: 8 octeti, intre cca io-308 si iO308, 15 cifre semnificative - pentru precizie suplimentara: long double (12 octeti) - contin mantisa, iar optional semn si exponent (prefix e sau E) -in mantisa, partea reala sau zecimala poate lipsi, dar nu amandoua - implicit, orice constanta reala e considerata double - sufix f sau F pentru float; 1 sau L pentru long double Exemple: 1 0 sau 1 sau lei 3 14159265358979323846 1 175494e-38f Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea Tipuri Operatori Expresii 8 : valori minime cerute de standard SHRT MiN, iNT MiN -32767 LONG MiN -2147483647 USHRT MiN, UiNT MiN 65535 SHRT MAX, iNT MAX 32768 LONG-MAX 2147483647 ULONG MAX 4294967295 Obs: pe gcc i386 Linux, int are aceleasi dimensiuni ca si long : valori pt gcc i386 Linux (si cerintele standard) FLT-DiG 6 FLT-MiN FLT-MAX FLT EPSiLON DBL MiN DBL MAX DBL EPSiLON DBL-DiG 15 (min 10)  * precizie 1 17549435e-38F (max 1E-37) 3 40282347e+38F (min 1E+37) 1 19209290e-07F (max 1E-5)  * nr min cu 2 2250738585072014e-308 (max 1E-37) 1 7976931348623157e+308 (min 1E+37) 2 2204460492503131e-16 (max 1E-9) zecimala *  1+eps > 1 *  Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea Tipuri Operatori Expresii 9 - int (chiar long): domeniu de valori mic (cca ± 2 miliarde) - e insuficient pentru multe calcule care implica aparent intregi Ex calculati e x = 1 - т1  1! + x2 2  - cu o precizie data (iO-5) Daca se calculeaza factorialul ca intreg, va da depasire pt n > 12 mai bine: fara factorial, cu recurenta intre termeni: in = in-i x n - pana la 9E15 tipul double distinge inca doi intregi consecutivi - o valoare citita de la intrare nu e reprezentata neaparat precis! float x; scanf ("° of", &x) ; printf ("° 0 7f" , x) ; 4 2 4 1999998 fractii exacte in baza 10 pot fi periodice in baza 2 1 2(10) = l (0011)(2) -in calcule matematice, adeseori comparatia == e insuficienta (pot apare pierderi de precizie pe parcurs) - mai bine: fabs(x - y) 1 Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea Tipuri Operatori Expresii 10 Operatorul sizeof returneaza numarul de octeti de memorie ocupati de un tip de date (sau o variabila sau constanta): #include void main (void) printf ("char t t° od n" , sizeof (char) ) ; printf ("short t t° 0d n" , sizeof (short) ) ; printf ("int t t° od n" , sizeof (int) ) ; printf ("long t t° 0d n" , sizeof (long) ) ; printf ("float t t° od n" , sizeof (float)) ; printf ("double t t° 0d n" , sizeof (double) ) ; printf ("long double t° 0d n" , sizeof (long double)); Caracterul ’ t’ (tab) sare la alinierea urmatoare (tipic: 8 caractere) Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea Tipuri Operatori Expresii 11 -operatorii uzuali binari: +, *,   pentru numere intregi si reale ATENtiE: pentru intregi,   inseamna impartire cu rest - operatorul ° 0 (numai pentru intregi): modulo (restul la impartire) 9 -5==-l 9° o-5==4 -9 5==-l -9° 05==-4 -9 -5==l -9° 0-5=-4 (restul are semnul deimpartitului) — operatorul unar - (minus; nu exista plus unar) in expresii aritmetice, caracterele sunt considerate ca si intregi (indicele caracterului respectiv in tabela ASCii) Exemplu: ’7’ - ’0’ == 7, ’a’ + 5 == 3i3 (cifrele, respectiv literele ocupa spatiu continuu in tabela de caractere) Precedenta: - unar, apoi *,  , ° 0, apoi +, - Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea Tipuri Operatori Expresii 12 - C nu are tip boolean; se foloseste int (C99: Bool, stdbool h) - operatorii logici produc 1 pt true, 0 pt false - un intreg e interpretat ca true daca e 7^ 0 si ca false daca e 0 : precedenta mai mica decat cei aritmetici x , >=, se poate scrie natural (x determina semnul caracterelor cu bitul 7 pe 1, si implicit semnul la conversia char -> int la conversia comparatia intre int si unsigned !! valorile > iNT-MAX sunt considerate negative ca int => rezultate incorecte   surprinzatoare   neintuitive int i; unsigned u = 3000000000;  * u > iNT MAX *  i = u + 5;  * bitul de semn 1 => i e considerat negativ *  if (i > u) printf ("° od > ° ou n", i, u) ;  * tipareste: -1294967291 > 3000000000 !!! *  Pentru a compara int i cu unsigned u -inlocuiti (i u) cu (i > o && i > u) Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea Tipuri Operatori Expresii 15 : partea dreapta convertita la tipul partii stangi - e posibila trunchierea daca atribuim la un tip de dimensiune mai mica => mesaje de avertizare de la compilator Exemplu: int i; char c; i = с; c = i;  * valoarea se pastreaza *  c=i; i=c;  * bitii superiori se pierd *  : partea dreapta e evaluata independent de tipul partii stangi! unsigned eur rol = 38400, usd rol = 32700; float eur usd; eur usd = eur rol   usd rol;  * 1 !!! *  (engl type cast) Sintaxa: ( nume tip ) expresie expresia este convertita ca in atribuirea unei variabile de tipul dat eur usd = (double) eur rol   usd rol;  * 1 17 *  int n; sqrt((double)n);  * double sqrt(double) in math h *  Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea Tipuri Operatori Expresii 16 propriu-zisa: var = expr (un operator ca oricare altul) => o expresie de atribuire poate fi folosita in alta expresie compusa (si valoarea ei e chiar cea a expresiei atribuite) a = b = c  * asociativ la dreapta, a = (b = c) *  if ((c = getcharO) != ’ n’) {  * folosim rezultatul in test *  } : Nu gresiti folosind atribuirea in loc de test de egalitate!! if (x = y) testeaza daca valoarea lui у (atribuita si lui x) e nenula : += = *=  = ° o= x += expr e o forma mai scurta de a scrie x = x + expr vezi ulterior si pentru operatorii pe biti " " &   prefix postfix: ++ — ++i incrementare cu 1, valoarea expresiei este cea de dupa atribuire i++ incrementare cu 1, valoarea expresiei este cea dinainte de atribuire int x=2, y, z; у = x++;  * y=2,x=3 * ; z = ++x;  * x=4,z=4 *  Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea Tipuri Operatori Expresii 17 — numara caracterele din sirul s in variabila i for (i = 0; s[i] != ’ 0’; i++) ;  * sirul se termina cu ’ 0’ *  sau, cu un test implicit de valoare nonzero, si preincrement: for (i = -1; s [++i] ; );  * corpul lui for este vid *  - copiaza sirul src in sirul dest; expresia atribuita serveste si pt test for (i = j = 0; dest[j++] ; ); = src - copiaza max N caractere; cand primul test e fals, se omite al doilea (deci nu se mai executa atribuirea) for (i = j = 0; i o expresie care contine mai multi operatori cu efect lateral poate avea rezultat   efect nedeterminat Exemple eronate: int i = 0; printf ("° od 70d", i++, i++) ;  *0 1 sau 1 0 * ) ; (argumentele unei functii se pot evalua in orice ordine) while (sEi] b) ? a : b;  * max(a, b) *  printf ("Numarul este ° os n", (n ! ++ — - ( tip) * & (pt adrese) sizeof *   7 Asociativitate && i i 7 • • = += -= etc > : in caz de dubiu, si pentru lizibilitate, folositi parantezele ! Utilizarea si Programarea calculatoarelor 2 Curs 3 Marius Minea Tipuri Operatori Expresii 23 in multe situatii frecvent intalnite in programe trebuie paranteze! - daca vrem sa atribuim o valoare si apoi sa o testam: while ((c = s [++i]) != ’ 0’) { * prelucram c cat e nenul * } dar: c = s[++i] != ’ 0’ ii da lui c o valoare booleana (0 sau 1) - daca vrem sa deplasam pe biti si apoi sa adunam: n = (hi dimensiunea spatiului starilor limiteaza aplicabilitatea (daca o stare are n biti, rezulta direct cate putem reprezenta in memorie) - tipic, limitat la cateva milioane de stari Daca spatiul starilor atinse e mic fata de spatiul potential complet, se poate incerca o codificare a starilor pe numar mai mic de biti ( , metoda folosita in SPiN) Metoda e insa doar o : daca se ajunge la o stare cu cod deja intalnit, explorarea se opreste (desi poate starea e diferita) o parte din spatiul starilor poate ramane neexplorata Verificare formala Curs 3 Marius Minea Model checking simbolic Diagrame de decizie binare 3 Calculul starilor care pot fi atinse din starile initiale (EF true^ - prin traversare a grafului pornind de la starile initiale - R: multimea starilor explorate; F: frontiera starilor atinse Cu Cu R = 0; F = Sq R = ( )', F = Sq while (F  = 0) while (F   R) choose s e F; R s7} forall s' with s s'  * eventual F = F   R if s'   Fu R * cu test F 0 *  F F U {s'} ^Algoritmul se exprima mult mai simplu daca se poate calcula multimea unei multimi de stari => mu iti mea R a starilor explorate creste la fiecare iteratie, dar e finita Verificare formala Curs 3 Marius Minea Model checking simbolic Diagrame de decizie binare 4 O noua abordare: explorarea de stari - ideea: o multime poate fi uneori reprezentata (printr-o formula) intr-un spatiu mai mic decat explicit pentru fiecare stare in parte - reprezentare eficienta pt multimi de stari, relatie de tranzitie [McMillan’92] - cu ajutorul diagramelor de decizie binare (BDD) [Bryant’86] idee cheie: Operarea cu multimi de stari - folosita si in cazul in care multimea starilor este infinita (sisteme in timp continuu, sisteme hibride) idee cheie: prelucrarea iterativa pana cand nu se mai produc modificari ^notiunea de Verificare formala Curs 3 Marius Minea Model checking simbolic Diagrame de decizie binare 5 Def: x G D este pentru f : D -> D daca  (x) = x Def: O e o multime partial ordonata in care orice submultime finita are un cel mai mic majorant si un cel mai mare minorant Ex: multimea partilor P(S) a lui S, cu relatia de incluziune C - Lucram cu functii r : P(S) P(S') peste laticea P(S) - Privim S' C S ca un predicat peste S: S'(s) = true s g S' in particular: 0 = false, S = true => t : P(S) -> P(S) este o transformare de predicate Def: t este monoton daca P C Q => r(F) C r(Q) t este continuu la uniune daca pentru orice sir С P2 C avem TfUj-Pj) = UjTt-Pj) t este continuu la intersectie daca pentru orice sir D F2 5 • • • avem r(PiPi) = fp-(Pi) Verificare formala Curs 3 Marius Minea Model checking simbolic Diagrame de decizie binare 6 O transformare de predicate monotona pe P(S) are intotdeauna — un punct fix minimal, notat liZ t(Z) — si un punct fix maximal, notat vZ r(Z') [Tarski] Daca S e finita si т e monotona, atunci т e continua la uniune si la intersectie t monotona т  False) C rl+1(False') si тг(Тше) D тг+1(Тше) Daca t e monotona si S e finita, exista i,j > 0 astfel ca Vfe > i, тк( False) = r^False) si Vfc > j, тк(Тгие) = ті(Тгиё) Daca t e monotona si S e finita, exista i,j > 0 astfel ca (j,Z t(Z) = r^False) si vZ t(Z) = ті(Тгиё) Verificare formala Curs 3 Marius Minea Model checking simbolic Diagrame de decizie binare 7 function Lfp(r : Trans) : Pred Q := False; function Gfp(r : Trans) : Pred Q := True; while (Q'  = Q) do while (Q'  = Q) do return Q; return Q; Verificare formala Curs 3 Marius Minea Model checking simbolic Diagrame de decizie binare 8 identificam formula CTL f cu multimea de stari {s | M, s |=  } AF f =  iZ f V AX Z EF   = tiZ f V EX Z EG  = vZ f A EX Z A [ i U f2] = [iZ E [ i U  2] = VZ A = vZ E = vZ • 2V( iAAXZ)  2V( iAEXZ) , 2Л( і VAXZ)  2A( i VEXZ) punct fix minimal: proprietati de evolutie: F punct fix maximal: proprietati de siguranta (invarianti): G Verificare formala Curs 3 Marius Minea Model checking simbolic Diagrame de decizie binare 9 Prin descompunere dupa structura formulei Check(j") returneaza {s g S | M, s |= f} Check(p) = {s g S | p G L(s)} propozitii atomice Check(->f) = S  Check(f') Check(f   g) = Check(f) n Check(g') Check(E X f) = CheckEX(Check(fY) CheckEX(J (y)) = 3v' [ ( ') Л R(y,v')] Check(E [f U5]) = CheckEU(Check(f), СІіеск(дУ) folosind E [Д U  2] = •  2 v (А л si functia Lfp Check(E G f) = CheckEG(Check(JY) folosind EG f = vZ f л EXZ si functia Gfp Aceste operatii de baza se pot implementa cu BDD-uri Verificare formala Curs 3 Marius Minea Model checking simbolic Diagrame de decizie binare 10 Binary Decision Diagrams (BDDs) • o reprezentare compacta si canonica a functiilor boolene • cu algoritmi eficienti de manipulare [R Bryant, "Graph-based algorithms for boolean function manipulation", iEEE Transactions on Computers, 1986] • impact deosebit asupra verificarii formale: ACM Kanellakis Award for Theory &l Practice, 1998 - Randal E Bryant: BDDs (’86) - Edmund M Clarke, E Allen Emerson: model checking (’81) - Ken McMilian: symbolic model checking (’92) Verificare formala Curs 3 Marius Minea Model checking simbolic Diagrame de decizie binare 11 Obiectul de lucru: functii Boolene f : Bn —> В reprezentari uzuale: tabele de adevar, diagrame Karnaugh, suma canonica de mintermi - dimensiune exponentiala suma redusa de produse, factorizari, etc - exponentiale pentru anumite functii comune (ex paritate) operatii elementare pot rezulta in crestere exponentiala (ex complementarea) reprezentari necanonice e dificil de testat: - echivalenta (dupa transformari in proiectarea circuitelor) - satisfiabilitatea: Ekri, • • -xn   •   ,xn) = 1 ? Ѵж Жж) =  2(ж) = ,3ж Д(ж) ф  2(ж) = 1 Verificare formala Curs 3 Marius Minea Model checking simbolic Diagrame de decizie binare 12 • noduri terminale: valoarea functiei (0 sau 1) • noduri neterminale: variabile • ramuri: Zow(v) (stanga)   hightv') (dreapta): atribuire 0 1 pt variabila din nod BDD-uri: obtinute prin 3 reguli de reducere Verificare formala Curs 3 Marius Minea Model checking simbolic Diagrame de decizie binare Verificare formala Curs 3 13 Marius Minea Model checking simbolic Diagrame de decizie binare  (ni) =  ("2) comaseaza n± si П2 Verificare formala Curs 3 14 Marius Minea Model checking simbolic Diagrame de decizie binare 0 Zow(n) = hightji) elimina testarea iu Verificare formala Curs 3 15 П Marius Minea Model checking simbolic Diagrame de decizie binare 16 Cele 3 reguli se pot aplica indiferent de ordonarea variabilelor Pentru a defini o BDD ordonata (Ordered BDD = OBDD) se impune o conditie esentiala: Pe toate caile de la varf la nodurile terminale, variabilele apar in (= exista o ordonare globala a variabilelor) Teorema: Pentru orice functie, reprezentarea ca BDD ordonata, redusa cf regulilor 1-3 e pana la un izomorfism => reprezentare canonica => testare de echivalenta sau satisfiabilitate in 0(1) Obs: Un subgraf cu radacina intr-un nod de BDD este tot o BDD Verificare formala Curs 3 Marius Minea Model checking simbolic Diagrame de decizie binare 17 Functia: (ai A 5i) V (a2 A 62) V (аз A 63) Crestere liniara: 2(n + l) Crestere exponentiala: 2n+1 Verificare formala Curs 3 Marius Minea Model checking simbolic Diagrame de decizie binare 18 function Apply(f, g : OBDD, op : Operator) : OBDD if is-leaf(f) A is-leaf(g) return op(f,g); elsif ( ,g,op, h) in apply cache return h; else x := topvar(f)  * variabila din varful lui f *  у := topvar(g) if (ord(x) = ord(y))  * x = у = aceeasi variabila *  h := find bdd(x, Apply(f  x=0,g  x=0,op),Apply(f |ж=і, г |ж=і,ор))  * find bdd creeaza un nou BDD daca nu exista deja *  elsif (ord(x) pointeri intr-un unic graf multi-radacina Gestiunea memoriei: cu contor de referinta si garbage-collection Un vast numar de optimizari si euristici: - metode de dispunere si traversare pt caching avantajos - calcul paralel si distribuit, etc Verificare formala Curs 3 Marius Minea Model checking simbolic Diagrame de decizie binare 22 Ordonarea variabilelor - efect critic asupra dimensiunii Exista functii cu reprezentari exponentiale indiferent de ordonare (ex bitul mijlociul al unui multiplicator [Bryant'91]) BDD-urile evolueaza in timpul executiei aplicatiei => f importanta reordonarea dinamica - efectuata transparent pentru algoritmii de verificare - reordonarea nivelelor adiacente nu modifica pointerii externi Verificare formala Curs 3 Marius Minea Model checking simbolic Diagrame de decizie binare 23 Relaxarea conditiei de ordonare: FreeBDDs - variabilele aparin orice ordine, fiecare doar o data - V atribuire la v, aceeasi ordine in toate functiile - reprezentari bune pt unele functii cu OBDD-uri exponentiale Alegerea relatiei de decompozitie functionala pentru OBDD: descompunerea Boole-Shannon: f = xAfsyxAfx fx = f lx=o '  cofactorul negativ fx = f |я;=і : cofactorul pozitiv Alte relatii de decompozitie: - f = fy ф x A fgx descompunere Reed-Muller - f = fx ф x A fgx descompunere Davio pozitiva unde fgx = fx ф fx Multiterminal BDDs: extensie cu noduri terminale arbitrare (intregi, etc ) Verificare formala Curs 3 Marius Minea Model checking simbolic Diagrame de decizie binare 24 Exemplu: codificare numerica pe 3 biti: f = xq + 2 * xi + 4 * x^ 4 Edge-Valued BDD (EVBDD) ponderi multiplicative pe muchii Binary Moment Diagram (BMD)   = fx + x • Ux - fs) Hybrid Decision Diagrams = BDD + BMD + MTBDD Verificare formala Curs 3 Marius Minea Model checking simbolic Diagrame de decizie binare 25 Cazul tipic: demonstrarea corespondentei dintre: - o descriere matematica (numerica) Fnum (ex operatia de inmultire) - un circuit fi,it cu operanzi in reprezentare binara Fie Num : Bn Z (sau R) functia care descrie semnificatia numerica a unui numar reprezentar binar Trebuie verificat: Num{fhit{xY, = Fmm(Nurn(xi), Num^')') => reprezentare eficienta pentru functii pe biti cat si numerice se utilizeaza EVBDD, BMD, HDD, etc Verificare formala Curs 3 Marius Minea Model checking simbolic Diagrame de decizie binare 26 Principala aplicatie: in CAD si verificare formala in general: pentru reprezentarea compacta a datelor cu o anumita regularitate structura comuna, dificil de exprimat analitic teoria codurilor structuri mari de date, indexare biologie computationala Exemplu: sistem de filtrare publish-subscribe in timp real - flux mare de mesaje; sute de mii de criterii de filtrare - criteriile de filtrare reprezentate ca structura de BDD-uri (propozitii atomice: atribut {relatie) valoare) - mesajele noi sunt filtrate prin algoritmi de evaluare a BDD-urilor - subcriteriile comune din BDD: evaluate o singura data Verificare formala Curs 3 Marius Minea Model checking simbolic Diagrame de decizie binare 27 Ken McMilian (CMU, 1987): ideea de a reprezenta sisteme in mod simbolic cu BDD-uri [Burch, Clarke, Dill, McMilian, Hwang: Symbolic model checking: iO20 states and beyond, 1990] => verificatorul SMV; teza de doctorat: Symbolic Model Checking: An Approach to the State Explosion Problem (CMU, 1992) independent: - Coudert, Berthet, Madre - Pixley [Motorola, 1990] Verificare formala Curs 3 Marius Minea Model checking simbolic Diagrame de decizie binare 28 Reprezentare: codificare binara pentru stari si propozitii atomice => BDD-uri pentru multimi de stari, relatie de tranzitie Check(p) = {s g S | p g L(s)} Check(^f) = S   Check(f) Check(f л g) = Check(f) n Check(g) Check(EXf) = CheckEX(Check(f)) CheckEX(J(y)) = Bv' [ ( ') л R(y, v')] bddJf then else(p, 1,0) bdd-not bdd-and RelProd(f, R, v') Check(E [f U g]) = CheckEU(Check(J), Check(g)) E [fi U  2] = •  2 V (А Л EXZ) Check^EG f) = CheckEG(Check(f)) EG f = i>Z f AEXZ algoritmul Lfp algoritmul Gfp Verificare formala Curs 3 Marius Minea Model checking simbolic Diagrame de decizie binare 29 O relatie de tranzitie monolitica poate deveni foarte mare principala dificultate: produsul relational partitionare disjunctiva (sisteme asincrone) R(v, v'j = R±(v, v'j V • • • V Rn(y, v'j prin distributivitate: 3v>[f(v>')  R(v,v'y] = = Л -Ri (", ')] V • • • V 3U'[ (U') Л Rn(v,v'y] partitionare conjunctiva (sisteme sincrone) H nu distribuie fata de л, dar se poate exploata localitatea (daca Ri nu depind de toate variabilele din U'): R(v,  w ) = R- Sjv, v^) л • • • л Rntjv, v") Л R(v, v7)] = = • • ЗЦД(ѵ') Л Я0(г>,^] Л -Ri(v,v'1)] • • • Л Rn(v,v'n)] (conjunctie si cuantificare succesiva pentru fiecare componenta) Verificare formala Curs 3 Marius Minea Model checking simbolic Diagrame de decizie binare 30 Restrictia de fairness: F = {P1,P2,-    ,Pn}, cu P{ C S EG f e adevarata in multimea maximala Z cu proprietatile: - toate starile din Z satisfac f —   Pk G F,s G Z exista un drum din s intr-o stare din Z n P^ (trecand doar prin stari care satisfac f) exprimare ca punct fix, poate fi calculata simbolic: EG fairf = vZ -f Л A?=i EX E [f U (Z A Pk)] La fel cu cele definite pentru reprezentarea explicita: Verificare formala Curs 3 Marius Minea Model checking simbolic Diagrame de decizie binare 31 Principalele avantaje ale tehnicii de model checking: - metoda complet automata - genereaza contraexemple care identifica erorile • formule existentiale (E) : produce o traiectorie "martor" (wiiness) pentru care formula este adevarata • formule universale (A): produce un contraexemplu • contraexemplul pentru o formula universala este traiectoria martor pentru negatia ei (formula existentiala duala) Verificare formala Curs 3 Marius Minea Model checking simbolic Diagrame de decizie binare 32 - punct fix minimal: EF f =  > Z f v EX Z - se obtin si se retin aproximari succesive f = Qq C Qi C C Qk - Qk multimea starilor din care se poate atinge f in cel mult к pasi - se gaseste o intersectie Qkn Sq 0 (o prima secventa de traversare: inapoi, simbolica) - se alege sk e Sq n Qk - se calculeaza multimea Succ(sk) a succesorilor lui sk - ea trebuie sa aiba o intersectie cu Qk-± (din sk se atinge f in cel mult к pasi, deci exista un succesor din care se ajunge in к - 1 pasi) - se alege sk ^ e Succ{sk} n Qk-±, etc pana la Qq = f (a doua traversare, inainte, prin stari individuale) - s-a gasit o traiectorie sk sq care atinge f Verificare formala Curs 3 Marius Minea Model checking simbolic Diagrame de decizie binare 33 -calcul prin iteratie (Gfp): EG  = vZ f    ?=1 EXE [JU (ZAPfe)] (*) - iteratii interioare (Lfp) pentru E[ U(ZAPJ], VP& -in ultima iteratie exterioara se retine sirul de aproximari Qq Q Qi C C Q?k C pentru care EG f APk e atins in i pasi - se alege o stare initiala sq |= EG f - din multimea de succesori Succ(sq) (vezi EXin (*)) se cauta si care atinge un Pk in numar minim de pasi: mini Succ(sq) nQ{ 0 (euristica greedy pentru gasirea unei traiectorii scurte) - se gaseste traiectoria: i pasi din si => i- 1 pasi din Succ(si) => alegem s2 e Succ(si) n Qi-i => se atinge e EG f n Pk - eliminam Pk, continuam din pana vizitam si ultimul Pj (in s') - daca s' |= EXE[ Usi], inchidem ciclul spre si avem martorul - daca nu, s' e in alta SCC decat si- Repetam procedeul din s' - graful SCC-urilor e aciclic => procedeul e finit Verificare formala Curs 3 Marius Minea Analiza programelor Curs 3 mai 2004 Marius Minea interpretare abstracta 2 O metoda pentru definirea unei a unui program, care poate fi utilizata pentru a analiza programul si a produce informatii despre comportamentul sau in executie [Cousot & Cousot ’77] inspirata din: — analiza fluxului de date sistematizeaza notiunile de proprietati analizate si caracteristicile fundamentale ale metodelor de analiza - semantica denotationala formalizeaza notiunea de a semanticii unui program (corectitudinea e nedecidabila => avem nevoie de aproximare) Analiza programelor Curs 3 Marius Minea interpretare abstracta 3 Consideram un limbaj care contine doarintregi si inmultire: e ::= i | e*e Definim semantica printr-o functie care da valoarea unei expresii:  1 : Exp int,  і(г) = i, * 62) = м(е1) * м(е2) Definim o functie de abstractie a : Exp 0, +} : !- daca i 0 — - 0 + si pentru expresii prin tabelul: + 0 -0 0 0 - 0 + La fel se poate introduce operatorul minus unar: - 0 + - + 0 - Analiza programelor Curs 3 Marius Minea interpretare abstracta 4 introducem operatia de adunare => abstractia nu mai e precisa + 1- 0 + 0 - 0 + Apar valori care nu pot fi determinate precis (se pierde precizia) => e necesara introducerea lui T = {-,0,+} => apare din nou notiunea de Analiza programelor Curs 3 Marius Minea interpretare abstracta 5 Similar, la introducerea operatorului de impartire  : nu putem imparti la zero si extindem toate operatiile si la L: ± op x = x op ± = ± Analiza programelor Curs 3 Marius Minea interpretare abstracta 6 unui program: un model matematic (formal) al tuturor comportamentelor posibile ale unui sistem de calcul care executa acel program, in interactiune cu orice mediu posibil [Cousot] Semantica unui limbaj de programare: defineste semantica oricarui program Abordare generala: semantica unui program poate fi definita ca solutie a unei (corespunzatoare iteratiei) => toate semanticile unui program pot fi organizate intr-o ierarhie, dupa nivelul lor de Analiza programelor Curs 3 Marius Minea interpretare abstracta 7 - secvente de executie (finite sau infinite): descriu in fiecare punct valoarea variabilelor din program - semantica operationala: descrie comportamentul la nivel de stari si tranzitii (ca si automat) - semantica denotationala: descrie rezultatul executiei (inel, neter-minare) - semantica naturala: ca mai sus, ignora aspectul neterminarii Analiza programelor Curs 3 Marius Minea interpretare abstracta 8 - abstractia semn - abstractia pe intervale - abstractia poliedrala (infasuratoarea convexa a valorilor) - abstractia octogonala (ecuatii de forma ±x < c, ±y < c, ±x±y < c) - abstractia modulo un numar, punctual sau pe intervale -abstractii nerelationale (ex abstractia carteziana): calculeaza abstractia individual pentru fiecare variabila, netinand cont de corelare - abstractii relationale: pastreaza corelarea intre variabile Analiza programelor Curs 3 Marius Minea